Чи існують надійні і якісні OCR-системи, доступні онлайн?
Для того щоб відредагувати інформацію, отриману зі сканера, необхідно застосувати технологію, яка отримала назву OCR, що в розшифровці і в перекладі на російську означає «оптичне розпізнавання символів». Ми задалися питанням, а чи існують надійні і якісні OCR-системи, доступні онлайн?
В області ж оптичного розпізнавання тексту, на жаль, ніяких революцій за останні п'ять років не сталося, хоча певні зміни все-таки відбулися. Наприклад, відчутно зрушився баланс від настільних систем розпізнавання до застосування веб-сервісів. Не можна сказати, що OCR-ринок пішов в онлайн, але зміна самої концепції використання комп'ютера, поширення мобільної техніки, Інтернету, «хмарних» сервісів - все це диктує ситуації, коли користувач опиняється перед фактом, що стаціонарного комп'ютера під рукою немає.
Але в разі крайньої необхідності можна сфотографувати і спробувати «згодувати» фотознімок одному з OCR-онлайн-сервісів. Найімовірніше, з часом такий шлях буде ставати все популярнішим, і тому ми вирішили відправитися на дослідження онлайн-пристроїв в пошуках гарного сервісу розпізнавання відсканованого тексту.
Ми не ставили перед собою завдання знайти неодмінно безкоштовний сервіс, припускаючи, що таких може просто не бути. Однак некомерційні ресурси даного типу все-таки знайшлися. Є також умовно безкоштовні, в яких можна розпізнати кілька сторінок «на пробу». У будь-якому випадку сервіс повинен підтримувати російську мову і не вимагати ніякої установки на комп'ютер: іноді це просто неможливо на службових машинах.
Якість останнього файлу було поганим як з дозволу, чіткості, так і по геометрії зображення, зате найближче до польових умов. Знімки були зроблені зі звичайних сторінок книги, з ділового звіту і містили крім тексту ще й нескладну таблицю. Саме з таким цілком реалістичним набором даних належало розібратися випробуваним.
Першим на старт вийшов Google зі своїми документами (docs.google.com). Не всі знають, що крім спільної роботи над матеріалом сервіс дозволяє розпізнати документ, завантажений у вигляді зображення або PDF. Ніяких особливих дій робити не потрібно, все виходить автоматично. Однак розмір файлу обмежений 2 Мбайт, так що повноцінний скан сторінки книги відправити не вдалося. Зменшивши розмір, ми змогли "витягти" редагований текст.
«Документи Google» легко розпізнали розворот сторінки і впоралися з текстом. Якість роботи можна оцінити не вище, ніж 4 бали з 5, тому що жодного абзацу без помилки не сталося. Однак це все ж на порядок швидше і легше, ніж набирати текст з чистого аркуша.
Зі складними вихідними файлами справа пішла гірше: якість розпізнавання впало до «трійки» за п'ятибальною шкалою і не вийшло розпізнавання складного форматування і таблиць. Проте задовільний результат був зафіксований, і ресурс цілком варто взяти на озброєння як дієвий спосіб отримати текст з PDF або картинки.
Переходимо до явного фаворита нашого тестування. Компанія Abbyy вже пару років пропонує скористатися всією потужністю свого OCR-механізму через веб-сервіс (finereader.abbyyonline.com). Відмінності від настільної версії, звичайно, є. Перш за все - в кількості підтримуваних мов ( «всього» 49 проти майже 200 в професійній версії FineReader), а також у відсутності будь-яких додаткових можливостей по обробці тексту після розпізнавання.
Вхідним форматом може бути практично будь-який популярний графічний формат або PDF без пароля, а вихідним - DOC, XLS, ODT, TXT і PDF. Завантажувати можна документи розміром до 30 Мбайт.
За використання чудо-сервісу, проте, доведеться заплатити. Можливість сканування купується посторінково, і за 100 стр. Треба буде викласти 7 доларів. Однак якість того варто - чисті 5 з 5!
На черзі у нас іноземний сервіс та перевірка того, як він справляється з російською мовою. OCRonline (www.ocronline.com) працює з 14 найпопулярнішими європейськими мовами. Послуга надається не безкоштовно, але при реєстрації нараховується п'ять безкоштовних «пробних» сторінок і, крім того, щопонеділка ваш баланс поповнюється безкоштовно до тих самих п'яти сторінок. Додаткові пакети можна купити за ціною від 8 доларів за 100 стр. І дешевше, якщо замовляти оптом.
Сам процес розпізнавання мало чим примітний. На виході в вашому розпорядженні буде текст у форматі DOC, TXT, PDF або RTF. А ось результати вийшли цікаві. Якісні зображення з фотоапарата і зі сканера з високою роздільною здатністю були розпізнані ідеально, фактично без єдиної помилки. Тверда п'ятірка! З картинкою низької якості сервіс також впорався на ура, навіть таблиця нікуди не пропала! Але помарок було більш ніж достатньо, так що відмінним таке розпізнавання назвати не можна. Але 4 з 5 - це дуже хороший показник. Обов'язково варто взяти цей ресурс на замітку для термінових завдань.
Проби показали, що цей сервіс дуже чутливий до якості оригіналу. Зображення зі сканера в повному дозволі дозволило отримати дуже хороший текст, практично без помилок. А ось робота зі складним ісходником не вдалася. Якість тексту залишає бажати кращого, і виправляти помилки в ньому може бути складніше, ніж надрукувати текст самому.
Скажемо відразу, перемоги не вийшло. Чи не звертаємо уваги на нарочито простий дизайн сайту, адже ми не за цим сюди прийшли. Максимальний розмір файлу всього 2 Мбайт - замало. Нехай підтримуються основні формати (але в PDF розпізнається тільки перша сторінка) і мов цілком вражаючий набір, але на виході тільки текст без форматування. Крім того, для завантаження кожного файлу потрібно вводити літери з CAPTCHA.
Доступний безкоштовний ліміт на 5 Мбайт завантажуються зображень в день. Якщо потрібно більше, то можна відкрити доступ на добу за допомогою платної SMS за заявленою ціною близько 20 руб.
Ресурс New OCR (www.newocr.com) обіцяє абсолютно безкоштовне застосування OCR-технології до наших відсканованим документам. І треба сказати, з непоганим функціоналом - за своїми можливостями даний сервіс дійсно непоганий. Судіть самі: 58 мов, два різних OCR-алгоритму на вибір, безлімітні завантаження без необхідності реєстрації і безкоштовно (!), Всі популярні формати, в тому числі багатосторінкові документи, і навіть завантаження файлів, що заархівували.
А що ж з якістю безпосередньо OCR? З якісними вихідними матеріалами new OCR впорався добре. Помилок мінімум, і лише деяка плутанина з форматуванням змушує поставити мінус до заслуженої п'ятірці. Можна спробувати поліпшити результат, вибираючи між двома механізмами розпізнавання.
Для повноти картини наведемо ще один сайт. Нічого сверхвидающегося він не обіцяє, зате безкоштовний і має гарний інтерфейс, в чому ви зможете переконатися самі, заглянувши на www.sciweavers.org/free-online-ocr. Підтримується 33 мови і всі популярні графічні формати для вихідного файлу. Якість розпізнавання не назвеш видатним, але на хорошій фотографії текст визначається з мінімумом помилок і майже не вимагає коректування. З поганими зображеннями біда, і від виходить набору символів ніякого толку. Зате безкоштовно - це раз, і супроводжується цілою оберемком інших корисних сервісів для розв'язання щоденних завдань конвертування цифрових даних - це два.
Оцінка за «читання»
Після ознайомлення з усіма цими системами можна зробити деякі висновки. По-перше, - і це хороша новина! - онлайн-сервіси з розпізнавання тексту є, і вони непогано працюють. Багато хто навіть безкоштовні, що, зізнаємося, стало приємним сюрпризом.
Деякі сервіси проте впоралися і з «важкими» випадками, так що саме їх ми впевнено ставимо в лідери огляду. Перш за все це FineReader Оnline. З безкоштовних ж онлайн-распознавателей краще за інших себе показав New OCR. Тому саме цим двом сервісів ми присудили значок «Hard'n'Soft рекомендує».
Розпізнати і перекласти!
У сучасному відкритому світі часто буває, що необхідно терміново зрозуміти, про що йде мова на аркуші паперу або в PDF-документі. Проблема в тому, що він може бути на іноземній мові. Значить, в пару до OCR-ресурсу потрібно знайти онлайн-перекладач.
Розглянутий нами в огляді безкоштовний сайт New OCR відразу після розпізнавання пропонує передати документ в Google Translate (translate.google.com). Це один з найвідоміших онлайн-перекладачів, який оперує десятками мовних пар, при цьому володіє простим інтерфейсом і не містить суворих обмежень на довжину тексту, що перекладається, так що відсканований документ вдасться прочитати відразу.
Від автоматичного перекладу чудес в частині досконалості чекати не доводиться, проте якість перекладу Google Translate вважається хорошим, і зазвичай саме цей сайт використовують в першу чергу.
Альтернативне рішення - це онлайн-сервіс www.trans-late.ru вітчизняної компанії ПРОМТ. Але тут встановлено ліміт у 3 тис. Символів для одноразового перекладу. Так що розворот книги довелося переводити в два прийоми.
Використовуючи ці або інші сервіси онлайн-переказів після оптичного розпізнавання, проблема сприйняття змісту матеріалу чужою мовою повинна просто зійти нанівець. Ще б об'єднати всі найкращі досягнення, так в одному інтерфейсі, так безкоштовно.