Djvu OCR 2.4
Програма Djvu OCR призначена для впровадження текстового OCR шару в djvu книги. Текстовий шар дозволяє використовувати пошук по документу і копіювати текст з djvu в doc (word) або txt.
Djvu OCR працює спільно з програмою FineReader 7/8/9 версій, призначеної для розпізнавання тексту.
Оцифровка відбувається в три етапи:
- Djvu OCR конвертує документ в формат tiff;
- FineReader розпізнає текст в отриманих зображеннях;
- Djvu OCR обробляє робочий проект Finereader, витягує необхідну інформацію і інтегрує текстовий шар в djvu.
Крім інтеграції програма може витягувати вже існуючий текстовий шар з djvu файлу (режим Витягти OCR Шар). Можна вказати діапазон сторінок для вилучення тексту або обробити весь документ. Вихідний формат: txt, html.
Програма не вимагає установки. В архіві 4 виконуваних файлу:
- DjvuOCR - Win32 GUI версія
- FRFGrab - консольна версія
- Djvused - стандартна утиліта пакету djvulibre
- cvthtml2 - конвертація OCR шару в HTML (UTF8)
Просунуті користувачі можуть використовувати консольную версію програми (докладний опис команд є в файлі довідки), іншим же достатньо запустити DjvuOCR.exe, який має звичний інтерфейс.
Для читання Djvu книг вам знадобиться DjVuReader. невелика програма з мінімальним необхідним набором функцій для навігації по документу.