Стаття стаття про статті, або так ось ти який, конвертер ...

Звичайно, можна зберегти документ Word в HTML. Формально можна. Фактично в результаті виходить якийсь кошмар. Хто не вірить може переконатися сам.

Результат: я втрачав вечір на повторне форматування статті. Після цього Грім підганяв файл HTML під формат сайту. І незважаючи на всі ці зусилля, вид статті залишав бажати кращого.

Як оформляти статтю для конвертера
Що конвертер здатний обробити

Зрозуміло, формат документа MS Word надто складний, щоб відразу ж реалізувати конвертування будь-якого файлу. На першому етапі довелося пожертвувати універсальністю і обмежитися найнеобхіднішими елементами тексту. Серед таких я виділив:
  • власне текстовий параграф, яких в статті зазвичай переважна більшість;
  • заголовок (розділу, підрозділу, пункту,); для початку я обмежився трьома рівнями укладення, будучи впевненим, що для не надто великий статті цього виявиться достатньо, але при необхідності їх кількість можна збільшити;
  • назва статті (поміщається в самому початку і виділяється розміром);
  • ненумерований перерахування (подібне до того, яке ви в даний момент читаєте);
  • нумерувати перерахування (в даній версії обмежився простим перерахуванням, без вкладеності).

Крім того, для повноцінної статті необхідно ще кілька елементів:
  • таблиці;
  • ілюстрації;
  • визначення термінів.

Над їх включенням я зараз працюю, вони повинні з'явитися в самому найближчому часі.

Як пояснити конвертера, що ви від нього хочете

Щоб конвертер зрозумів, як слід обробляти той чи інший фрагмент тексту, слід оформити цей фрагмент за допомогою відповідного стилю Word. Для кожного елемента оформлення передбачений відповідний стиль (більшість з них стандартні для MS Word).

Щоб полегшити застосування стилів при написанні статті, я створив спеціальний шаблон для цієї мети, Article.dot. Він містить тільки допустимі стилі.

Якщо в процесі роботи конвертер зустрічає незнайомий йому стиль, він оформляє параграф, як звичайний текстовий, але при цьому видає попередження.

Так виглядають різні заголовки:

Наступний стиль створений спеціально для конвертера:

Ненумерований перерахування виглядає так:
  • елемент перерахування;
  • елемент перерахування;
  • елемент перерахування.
  • нумерувати перерахування

У цьому стилі теж немає нічого несподіваного:
  • Перший рядок перерахування.
  • Другий рядок перерахування.
  • Третя і остання рядок.

На відміну від попередніх стилів, ці два стилі явно включати не потрібно. Просто скористайтеся відповідними кнопками на палітрі інструментів Word.

Як працювати з конвертером

На жаль, в даний момент можливість включення ілюстрацій в текст статті ще не реалізована, тому у мене немає технічної можливості продемонструвати діалогове вікно конвертера (оскільки я вирішив бути кришталево чесним і оформити статтю про конвертері самим же конвертером, не вдаючись до додаткових засобів форматування і не шахраюючи).

Втім, інтерфейс конвертера гранично простий і не повинен викликати жодних труднощів. Просто виберіть вихідний файл Word і запустіть обробку незабаром з вихідним з'явиться файл з тим же ім'ям і розширенням .txt, це і є результат.

Чого ще не вміє конвертер

На жаль, список поки нереалізованих можливостей не вичерпується наведеними елементами тексту. Крім цього, конвертер поки не вміє виділяти фрагменти тексту жирним шрифтом, курсивом, підкресленням і кольором. Ці недоліки також планується усунути в найближчому майбутньому.

Оскільки програма зготована наспіх для перевірки основних ідей, при її роботі можуть виникнути деякі проблеми, з якими я поки не боровся.

Не рекомендується запускати програму, якщо в системі працює MS Word. Також не слід запускати Word під час виконання програми. Сподіваюся, це обмеження не здасться занадто суворим, а в наступних версіях я сподіваюся і зовсім від нього позбавитися.

Схожі статті