Програми для розпізнавання тексту

Програми для розпізнавання тексту
Як правило, якщо мова заходить про програми для розпізнавання відсканованого тексту (OCR, оптичне розпізнавання символів), більшість користувачів згадують єдиний продукт - ABBYY FineReader, який, безперечно, є лідером серед такого програмного забезпечення в Росії і одним з лідерів в світі.

Проте, FineReader - не єдине такого роду рішення: є безкоштовні програми для розпізнавання тексту, онлайн-сервіси для цих же цілей і, більш того, такі функції присутні і в деяких знайомих вам програмах, які, можливо, вже встановлені на вашому комп'ютері . Про все це я і постараюся написати в цій статті. Всі розглянуті програми працюють в Windows 7, 8 і XP.

Лідер розпізнавання текстів - програма ABBYY Finereader

Програми для розпізнавання тексту

Установка пробної версії FineReader не викликало ніяких проблем. ПО може інтегруватися з Microsoft Office і Провідником Windows, для того щоб було зручніше розпочати розпізнавання. З обмежень безкоштовної пробної версії - 15 діб використання і можливість розпізнати не більше 50 сторінок.

Програми для розпізнавання тексту

Знімок для тестування програм розпізнавання

Програми для розпізнавання тексту

Меню програми FineReader

FineReader може отримувати графічне зображення тексту безпосередньо зі сканера, з графічних файлів або камери. У моєму випадку, досить було відкрити файл зображення. Результат порадував - всього пара помилок. Відразу скажу, що це найкращий результат з усіх перевірених програм при роботі з даним зразком - схоже якість розпізнавання було тільки на безкоштовному онлайн сервісі Free Online OCR (але в цьому огляді ми говоримо тільки про програмні засоби, що не онлайн розпізнаванні).

Програми для розпізнавання тексту

Результат розпізнавання тексту в FineReader

CuneiForm - безкоштовна програма для розпізнавання тексту

Установка програми також дуже проста, ніякого сторонніх програм (як багато безкоштовне ПО) вона встановити не намагається. Інтерфейс лаконічний і зрозумілий. У деяких випадках найпростіше скористатися майстром, для чого призначена перша з іконок в меню.

З зразком, яким я користувався в FineReader, програма не впоралася, або, точніше, видала щось погано читається і недоноски слів. Друга спроба була зроблена зі скріншотом тексту з сайту самої цієї програми, який, правда, довелося збільшити (їй потрібні скани з дозволом 200dpi і вище, скріншоти з товщиною ліній шрифтів 1-2 пікселя вона не читає). Тут вона впоралася добре (частина тексту не розпізнає, так як був обраний тільки російську мову).

Програми для розпізнавання тексту

Розпізнавання тексту в CuneiForm

Таким чином, можна припустити, що CuneiForm - це те, що слід спробувати, особливо якщо у вас якісно відскановані сторінки і ви хочете розпізнати їх безкоштовно.

Microsoft OneNote - програма, яка у вас, можливо, вже є

Програми для розпізнавання тексту

Розпізнавання в Microsoft OneNote

Не можу сказати, що текст розпізнається ідеально, але, наскільки я можу судити, наскільки краще навіть ніж в CuneiForm. Плюс програми, як уже було сказано, в тому, що з неабиякою ймовірністю вона вже встановлена ​​на вашому комп'ютері. Хоча, звичайно, її використання в разі необхідності роботи з великою кількістю відсканованих документів навряд чи буде зручним, скоріше вона підійде для швидкого розпізнавання візиток.

OmniPage Ultimate, OmniPage 18 - має бути, щось дуже круте

Програми для розпізнавання тексту

Ціна на ПО OmniPage

Якщо ознайомитися з характеристиками і відгуками, в тому числі і в російськомовних виданнях, в них зазначається, що OmniPage дійсно забезпечує якісне і точне розпізнавання, в тому числі і російською мовою, порівняно легко розбирає не самі якісні скани і надає набір додаткових інструментів. З недоліків виділяють не найзручніший, особливо для початківців, інтерфейс. Так чи інакше, на західному ринку OmniPage - прямий конкурент FineReader і в англомовних рейтингах вони борються саме між собою, а тому, думаю, програма повинна бути гідною.

Це далеко не всі програми даного типу, існують також різні варіанти невеликих безкоштовних програм, але, поки експериментував з ними знайшов два головні недоліки їм властивих: відсутність підтримки кирилиці, або різне, не дуже корисне ПО в комплекті установки, а тому вирішив не згадувати їх тут.

А раптом і це буде цікаво:

Схожі статті