OCR کوته نوشت بازشناسی نوری نویسهها یا نویسهخوان نوری است. OCR ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی بکار گرفته میشد. واژه نوری در مقابل عبارت مرکب مغناطیسی قرار داده شد تا این روش را از روش قدیمیتر بازشناسی نویسهها با مرکب مغناطیسی MICR متمایز کند. با گذشت زمان و پیشرفت قابل توجه در این زمینه، روشهای بازشناسی دستنوشته و متون چاپی مطرح شدند که دامنه کار را به کلمات و عبارات رساندند. با وجود عدم تطبیق دقیق OCR با این موارد، این نام برای این روشها و تا حدی برای بازشناسی دستنوشتههای برخط هم استفاده شد و رواج پیدا کرد. این روزها OCR را بیشتر برای بازشناسی مستندات چاپی مثل صفحات کتابها، مجلهها و نامههای چاپی بکار میبرند.
یک سامانه OCR مثل یک نفر ماشین نویس، یک متن را میخواند و آن را به قالب مناسب برای ذخیره در کامپیوتر تبدیل میکند. معمولاً یک روبشگر تصویر متن را برای OCR فراهم میکند. این تصویر معمولاً از نقاط سیاه و سفید تشکیل میشود. سامانه OCR اشیاء موجود در این تصویر را که ارقام، حروف، علائم و کلمات هستند، بازشناسی میکند و نام آنها را در قالب مناسب ذخیره میکند. یک فایل تصویری حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی یک سامانه OCR بسیار کم حجم و قابل جستجو است.
منبع: پژوهشنامهی نویسهخوان نوری (OCR) فارسی
یک سامانه OCR مثل یک نفر ماشین نویس، یک متن را میخواند و آن را به قالب مناسب برای ذخیره در کامپیوتر تبدیل میکند. معمولاً یک روبشگر تصویر متن را برای OCR فراهم میکند. این تصویر معمولاً از نقاط سیاه و سفید تشکیل میشود. سامانه OCR اشیاء موجود در این تصویر را که ارقام، حروف، علائم و کلمات هستند، بازشناسی میکند و نام آنها را در قالب مناسب ذخیره میکند. یک فایل تصویری حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی یک سامانه OCR بسیار کم حجم و قابل جستجو است.
منبع: پژوهشنامهی نویسهخوان نوری (OCR) فارسی