Рукописний текст
Досить вагомий відсоток ділових та офісних документів містить рукописний текст. Згідно з дослідженнями. ці дані відіграють ключову роль і в обов'язковому порядку потрапляють в облікові системи шляхом ручного введення. Підприємства не намагаються автоматизувати цю роботу, в результаті, введення даних забирає багато ресурсів і часу. Чому? Рукописний текст, також як і друкований, можна витягати з документів, отримуючи при цьому максимальну точність. Пропоноване рішення Form Xtra Capture. якнайкраще, підходить для цих завдань. Тепер розпізнавання рукописного тексту, цифр, образів повністю автоматизовано.
Звичні багатьом програми для розпізнавання тексту відрізняються від рішень по вилученню даних. І на те є свої причини. Облікових програм потрібні дані, а не редаговані форми з різними графічними елементами (таблиці, рамки, лінії, зарубки і логотипи). Для автоматизації введення потрібно підготовчий етап - налаштування, де користувач вказує яку інформацію витягувати, як її обробляти, розпізнавати і експортувати. Для більш детального ознайомлення з основними етапами роботи (в т.ч. і настройки) системи дивіться схему роботи. Ми ж зосередимося на розпізнаванні рукописного тексту в документах, виділяючи важливі особливості:
- Використання контекстної інформації
Система не завжди може побудувати впевнену гіпотезу відповіді. І причин для цього маса: погана якість паперового носія або скан, колір пише інструменту, занадто зв'язний і нерозбірливий почерк. Використання словників, підібраних з урахуванням слів і фраз, які прийняті в конкретній галузі, дозволяють істотно поліпшити розпізнавання письмового тексту. Словники надають список можливих відповідей, які використовуються системою, щоб визначити найкращий варіант з можливих. Див. Також статтю: розпізнавання рукописного тексту: Cловарь і ICR
Регулярні вирази - вкрай корисний інструмент, який можна використовувати для розпізнавання складних послідовностей символів.
Помилки в проектуванні документа можуть призводити до невизначеності при її заповненні. В результаті замість одного варіанту написання з'являється безліч альтернативних варіантів, які теж є правильними. Для прикладу: Харкiв. мХаркiв (точка знаходиться в осередку з буквою "м"), м.Харкiв (точка знаходиться в окремій клітинці). Більш того, специфіка різних регіонів України дозволяє сміливо припустити, що люди заповнюють документи на рідній мові, ігноруючи вимоги і основна мова документа. Приклад: Харків. гХарьков. м.Харків. Використання псевдонімів (alias) дозволяє перетворити всі відповіді распознавателя до єдино правильної відповіді.
Досить часто до витягується рукописному полю пред'являють підвищені вимоги до точності розпізнавання. У подібних випадках є можливість розпізнавати одне і теж поле різними способами або двигунами (ABBYY FineReader Engee, CuneiForm та інші), а після, порівнювати відповіді для знаходження істини.
Рішення та послуги, які ми пропонуємо, дозволяють обробляти документи набагато швидше й ефективніше. Позбавте Ваше підприємство від складної, рутинної і малоцікавою роботи.
Ми вміємо розпізнавати рукописний текст краще за інших!