OCR کوته نوشت بازشناسی نوری نویسه‌ها یا نویسه‌خوان نوری است. OCR ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی بکار گرفته میشد. واژه نوری در مقابل عبارت مرکب مغناطیسی قرار داده شد تا این روش را از روش قدیمیتر بازشناسی نویسه‌ها با مرکب مغناطیسی MICR متمایز کند. با گذشت زمان و پیشرفت قابل توجه در این زمینه، روش‌های بازشناسی دست‌نوشته و متون چاپی مطرح شدند که دامنه کار را به کلمات و عبارات رساندند. با وجود عدم تطبیق دقیق OCR با این موارد، این نام برای این روش‌ها و تا حدی برای بازشناسی دستنوشته‌های برخط هم استفاده شد و رواج پیدا کرد. این روزها OCR را بیشتر برای بازشناسی مستندات چاپی مثل صفحات کتاب‌ها، مجله‌ها و نامه‌های چاپی بکار می‌برند.

یک سامانه  OCR مثل یک نفر ماشین نویس، یک متن را میخواند و آن را به قالب مناسب برای ذخیره در کامپیوتر تبدیل میکند. معمولاً یک روبشگر تصویر متن را برای  OCR فراهم میکند. این تصویر معمولاً از نقاط سیاه و سفید تشکیل میشود. سامانه  OCR اشیاء موجود در این تصویر را که ارقام، حروف، علائم و کلمات هستند، بازشناسی میکند و نام آنها را در قالب مناسب ذخیره میکند. یک فایل تصویری حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی یک سامانه  OCR بسیار کم حجم و قابل جستجو است.

منبع: پژوهش‌نامه‌ی نویسه‌خوان نوری (OCR) فارسی