Використання djvu sep

Використання DjVu Sep

Програма DjVu Sep морально застаріла. Замість неї слід використовувати програму DjVu Imager.

1. Введення

Програма DjVu Sep v2.3 (978 КБ) призначена для кодування в формат DjVu напівтонових ілюстрацій (зустрічаються на сканах книг) по методу розділених сканів (МРС). DjVu Sep на практиці втілює в собі МРС. Програма має Вільно-безкоштовну ліцензію GPL і повністю відкриті вихідні коди (59 КБ).

DjVu Sep використовує різновид методу розділених сканів. яку я пропоную назвати умовно "технологія вставки розділених сторінок". Можливий англійський варіант: "Separated pages insertion technology".

Напівтонові ілюстрації - це сірі (або кольорові) фотографії об'єктів реального світу або інші реалістичні малюнки, що складаються (на вигляд) з об'єктів різних відтінків сірого кольору (або багатобарвні) (не плутати з чорно-білими малюнками - тобто складаються тільки з об'єктів чорного і білого кольорів).

Сенс методу розділених сканів (МРС) полягає в тому, щоб підмінити при кодуванні в DjVu автоматичну сегментацію (з використанням documenttodjvu - звичайний варіант) ручної (з використанням csepdjvu). Це дає повний контроль над сегментацією, що забезпечує наступні переваги:

1. Виключення помилок кодування (візуальних артефактів).

2. Можливість підібрати вручну для кожної напівтонової ілюстрації оптимальне співвідношення стиснення "розмір-якість".

3. Оптимальне стиснення (в DjVu) різних за своєю суттю об'єктів - тексту і напівтонових малюнків.

МРС слід застосовувати для чорно-білих книг, що містять напівтонові ілюстрації - це, наприклад, всілякі каталоги (див. Рис. 1), підручники з використання комп'ютера з зображеннями діалогових вікон (див. Рис. 2) і т.п. Для таких книг МРС дає дуже хороші результати.

Використання djvu sep

Мал. 1. Каталог продукції з фотографіями.

Використання djvu sep

Мал. 2. Комп'ютерний підручник з зображеннями діалогових вікон.

МРС не завжди дає хороші результати для книг, що містять малокольорових об'єкти - кольоровий текст, малюнки плакатного типу, схеми з монотонних квітів тощо - а саме, він часто дає програш за розміром результуючого DjVu-файлу - в порівнянні з автоматичною сегментацією, яка відправляє такі малюнки частково в задній фон DjVu-файлу (а МРС поміщає їх цілком в шар переднього плану), що значно знижує розмір результуючого DjVu-файлу. Для таких книг краще застосовувати (після спеціальної обробки у СканКромсаторе v5.91) або автоматичну сегментацію (з використанням documenttodjvu), або метод Minor'а.

2. Застосування МРС

Загальна схема обробки сканів з напівтоновими ілюстраціями виглядає так:


ScanKromsator v5.91 -> DjVu Small v0.3.3 -> DjVu Sep v2.3

2.1. Обробка в ScanKromsator v5.91


Мал. 3. Вихідний скан з напівтонової
картинкою (взято з сайту U235).
Картинка укладена в Picture-зону
(В СканКромсаторе v5.91) - прямокутник
з рідкісного червоного пунктиру.

1. Завантажуємо в ScanKromsator v5.91 скани книги (в режимі Greyscale), що містять напівтонові ілюстрації (як завжди).

2. Складаємо завдання для шматування: розставляємо опції, різаки тощо (як зазвичай).

3. У процесі складання завдання укладаємо попадаються на сканах напівтонові ілюстрації в Picture-зони (виділяємо на око мишкою і по правій кнопці призначаємо тип зони як Picture-зона) (див. Рис. 3).

4. Пройшовши по всім Сканія і склавши завдання, натискаємо на кнопку Process! .

5. Переходимо до головного вікна і в меню Zones -> Picture zone -> Merge zones. ставимо прапорець Create separate files for non-b / w zones. тиснемо ОК і погоджуємося з питанням Merge zones for output files? .

6. ScanKromsator v5.91 обробить кожен скан, де присутня хоч одна Picture-зона, особливим чином:

- Кожен такий скан буде "розбитий" на 2 т.зв. "Субскана" - субскан переднього плану (foreground subscan) і субскан заднього фону (background subscan). (Див. Рис. 4 і 5).

- Субскан переднього плану (в чорно-білому форматі) - це вихідний скан за вирахуванням напівтонової картинки.

- Субскан заднього фону (в сірому або кольоровому форматі) - це вихідний скан за вирахуванням всього, що не відноситься до напівтонової картинці (якщо на початковому скане 2 або більше Picture-зони, то всі вони адекватно переносяться на субскан заднього фону).

Мал. 4. Субскан переднього плану (foreground subscan) - чорно-білий.

Мал. 5. Субскан заднього фону (background subscan) - сірий.

Таким чином, субскани виходять такими, щоб при прозорому накладення другого на перший вийшов вихідний скан.

7. На виході з ScanKromsator v5.91 ми отримуємо папку out, в якій знаходиться суміш простих сканів, пар субсканов, і т.п.

ПІДСУМОК: Таким чином, ScanKromsator v5.91 розбиває кожен вихідний скан з напівтонової ілюстрацією (де є Picture-зони) на відповідну йому пару субсканов.

2.2. Обробка в DjVu Small v0.3.3

DjVu Small v0.3.3 в даному контексті застосовується для того, щоб створити підсумкову DjVu-книгу без сторінок, що містять напівтонові малюнки (тих самих, які ми обробляли в попередньому пункті).

Для цього в DjVu Small, починаючи з версії 0.3.2, додана нова опція "Пропускати sep-файли з СК 5.91". Ця опція включена за замовчуванням (насправді я при всьому бажанні не можу уявити собі випадок, коли цю опцію треба було б відключати). При цьому мається на увазі, що субскани мають імена в базовій нотації СканКромсатора 5.91, а саме:
- Субскани переднього плану: 0001.tif, 0002.tif. 0100.tif.
- Субскани заднього фону 0001.sep.tif, 0002.sep.tif. 0100.sep.tif.

Послідовність роботи з програмою виглядає як зазвичай:

1. Завантажуємо папку out, отриману в ScanKromsator v5.91 в попередньому пункті - прямо "як є", тобто без будь-якої розсортування її вмісту по сортам сканів (звичайні, картинки, і т.п.). Завдяки опції "Пропускати sep-файли з СК 5.91" DjVu Small v0.3.3 автоматично відсіє на вході все "зайве" вміст папки out (субскани і картинки) і завантажить в програму тільки звичайні скани (з папки out). Можна просто перетягнути і "кинути" (через Drag-n-Drop) папку out в віконце "Введіть файл (и):".

2. Вибираємо профіль кодування (зазвичай це user B / W (600 dpi)) і натискаємо кнопку "Пуск".

3. Через деякий час отримуємо (за замовчуванням на робочому столі) файл "DjVu Encoded.djvu". Це - DjVu-книга без сторінок, що містять напівтонові малюнки. Давайте назвемо її умовно "DjVu-заготовка".

Примітка: При звичайній роботі (без напівтонових ілюстрацій) DjVu Small v0.3.3 використовується так само. Опцію "Пропускати sep-файли з СК 5.91" відключати не треба.

2.3 Обробка в DjVu Sep v2.3

DjVu Sep працює наступним чином: вона створює з кожної пари субсканов (отриманих в ScanKromsator v5.91 в п. 2.1) односторінкові DjVu-файли за методом розділених сканів (МРС) (при цьому субскан переднього плану "перетворюється" в шар переднього плану, а субскан заднього фону - в шар заднього фону створюваного двошарового DjVu-файлу). Далі кожен такий утворять єдиний DjVu-файл вставляється між сторінок цільової DjVu-книги - за допомогою djvm. Саме таким способом досягається ілюстрування цільової DjVu-книги. Зауважимо, що в DjVu-заготівлі (після DjVu Small) були відсутні сторінки з ілюстраціями (ми так зробили спеціально) - з таким розрахунком, щоб DjVu Sep вставив їх, і вже прямо з ілюстраціями.

Такий спосіб ілюстрування DjVu-книг вже розглядається як архаїчний - тому замість DjVu Sep рекомендується іспользоватьпрограмму DjVu Imager.

У формату DjVu немає поняття "сірий" - тому шар заднього фону DjVu-файлу можна завжди вважати "кольоровим".

Послідовність роботи з програмою виглядає так:

1. Завантажуємо папку out, отриману в ScanKromsator v5.91 в п. 2.1 - прямо "як є", тобто без будь-якої розсортування її вмісту по сортам сканів (звичайні, картинки, і т.п.). Можна просто перетягнути і "кинути" (через Drag-n-Drop) папку out в віконце "Введіть файл (и):".

DjVu Sep автоматично відсіє на вході все "зайве" для нього вміст папки out (звичайні скани) і завантажить в програму тільки пари субсканов (з папки out). Точніше, при відкритті ми вказуємо програмі на субскани заднього фону, що знаходяться в папці out, і після натискання OK програма автоматично знаходить (в папці out) і завантажує відповідні субскани переднього плану (перевіряючи при цьому комплектність завантажених пар субсканов).

При цьому важливо розуміти, що субскани повинні мати імена в базовій нотації СканКромсатора 5.91, а саме:

- Субскани переднього плану: 0001.tif, 0002.tif. 0100.tif.

- Субскани заднього фону 0001.sep.tif, 0002.sep.tif. 0100.sep.tif.

Якщо Ваші субскани мають якісь специфічні префікси або суфікси - то Вам необхідно спочатку ПРЯМО ПЕРЕДБАЧЕНА їх (префікси-суфікси) задати в розділі "Опції" (прапорець Довільні файли) - і тільки після цього завантажувати субскани в програму - в іншому випадку програма просто не зрозуміє, де які субскани і куди їх вставляти.

3. Для кожного субскана заднього фону в списку можна задати індивідуальні значення параметрів кодування (ДЗФ і Якість задн. Фону). Для цього клікніть мишкою на потрібний елемент списку завантажених файлів, виберіть селектор Поточний файл і встановіть потрібні значення ДЗФ і Якість задн. фону. При цьому поточний файл виділиться жирним шрифтом в списку. Для скидання індивідуальних значень параметрів кодування (даного файлу - тобто того, який виділений в списку) виберіть селектор Всі файли. Для скидання індивідуальних значень (параметрів кодування) всіх файлів передбачена кнопка С - при її натисканні всім "індивідуальним" файлів виставлять поточні настройки "загальних" файлів (тобто "індивідуальні" файли повністю зрівняються з "загальними" - тим самим переставши бути " індивідуальними ").

7. Натисніть кнопку Істочн. і виберіть у вікні DjVu-заготовку, отриману в попередньому пункті (за замовчуванням - файл "DjVu Encoded.djvu" на Робочому столі). Натисніть на кнопку Вставити в DjVu. Програма створить копію DjVu-заготовки (по шляху, вказаному в поле зліва від кнопки Призначено. - за замовчуванням це Робочий Стіл - і з суфіксом "out" за замовчуванням) і автоматично вставить отримане безліч односторінкових DjVu-картинок (з п. 2.3.6 ) у відповідні місця копії DjVu-книги (орієнтуючись по іменах DjVu-картинок).

Ця копія DjVu-книги - і є результат роботи програми. Вона є повністю готовою до вживання DjVu-книгою з ілюстраціями.

3. Терміни статті

1. Метод розділених сканів (МРС) - Методика DjVu-кодування з ручною сегментацією.

2. Метод Minor'а - малокольорових методика DjVu-кодування (логічно доповнює МРС).

3. Субскан - одна з 2 МРС-компонент вихідного ськана.

4. Субскан переднього плану (foreground subscan) - чорно-білий субскан - прототип 1 шару майбутнього DjVu-файлу.

5. Субскан заднього фону (background subscan) - сірий (кольоровий) субскан - прототип 2 шари майбутнього DjVu-файлу.

6. Пара субсканов - результат МРС- "розбиття" вихідного ськана.

7. DjVu-картинка - пара субсканов, "перетворена" в готовий 2-шаровий, утворять єдиний DjVu-файл.

8. DjVu-заготовка - DjVu-книга без сторінок, що містять напівтонові малюнки.

9. DjVu-книга - готовий до використання багатосторінковий DjVu-файл.

Схожі статті