У цій специфікації визначається XHTML 1.0, переформулировка HTML 4 у вигляді додатку XML 1.0, і три DTD. відповідних типів, що визначаються HTML 4. Семантика елементів і їх атрибутів визначена в рекомендації W3C HTML 4. Ця семантика є основою для майбутнього розширення мови XHTML. Сумісність з існуючими для користувача агентами HTML забезпечується шляхом відповідності наступним декільком вимогам.
Статус цього документа
Цей документ розглядався членами W3C і іншими зацікавленими сторонами і схвалений Директором в якості Рекомендації W3C. W3C. Це постійний документ; він може використовуватися в якості довідника або приводитися в інших документах як нормативного. Роллю W3C в цій рекомендації є привернення уваги до цієї специфікації і розширення сфери її застосування. Це розширює функціональність і можливість взаємодії в Web.
XHTML являє собою сімейство наявних на даний момент і які можуть виникнути в майбутньому типів документів і модулів, які є копіями, подмножествами або розширеннями мови HTML 4 [HTML]. Сімейство типів документів XHTML базується на XML і призначене для роботи з одними агентами на базі. Більш детальну інформацію про це сімействі і його еволюції можна знайти в розділі "Напрями розвитку".
XHTML 1.0 (справжня специфікація) представляє перший тип документів сімейства XHTML. У ній три типи документів HTML 4 переформуліруются в термінах XML 1.0 [XML]. Вона призначена для використання в якості мови вмісту, як відповідного XML, так і, за певних умов, деякі прості вимоги. працюючого в конформних користувальницьких агентів HTML 4. Розробники, які переносять свої документи в XHTML 1.0, отримають такі переваги:
- Документи XHTML відповідають XML. Як такі вони без праці проглядаються, редагуються і перевіряються на коректність стандартними засобами XML.
- Документи XHTML можуть працювати краще, ніж вони працювали в існуючих користувальницьких агентів, відповідних HTML 4, а також в нових користувальницьких агентів, відповідних XHTML 1.0.
- Документи XHTML можуть використовувати прикладні програми (наприклад, скрипти і аплети), що базуються на HTML Document Object Model або XML Document Object Model [DOM].
- У міру розширення сімейства XHTML документи, відповідні XHTML 1.0, будуть з більшою ймовірністю сумісні з різними середовищами XHTML.
Сімейство XHTML є наступним кроком в еволюції Інтернет. Переходячи сьогодні на XHTML, розробники вмісту (контенту) можуть вступити в світ XML з усіма його перевагами, зберігаючи при цьому сумісність вмісту з більш старими і більш новими версіями.
Історія SGML почалася в середині 80-х років; весь цей час мова була досить стабільний. В основному ця стабільність обумовлена тим фактом, що ця мова одночасно багатий і гнучкий. Така гнучкість, однак, має зворотний бік - рівень складності, що робить неможливим використання цієї мови в різноманітних середовищах, включаючи World Wide Web.
HTML створювався як мова обміну науковими та іншими технічними документами, придатний для використання людьми, які не є фахівцями в області документів. HTML успішно справлявся з проблемою складності SGML шляхом визначення невеликого набору структурних і семантичних тегів, придатних для створення відносно простих документів. Крім спрощення структури документа, в HTML внесена підтримка гіпертексту. Мультимедійні можливості були додані пізніше.
В дивно короткий термін HTML став дуже популярним і переріс своє первісне призначення. У порівнянні з відправною точкою, було придумано безліч нових елементів для використання в HTML (як стандартних) і для адаптації мови HTML до вертикальних, вузькоспеціалізованим, ринків. Такий достаток нових елементів викликало проблеми сумісності документів між різними платформами.
Оскільки різноманіття програмного забезпечення та платформ тільки збільшується, ясно, що придатність 'класичного' мови HTML 4 для всіх цих платформ досить обмежена.
XML ™ - це скорочення від Extensible Markup Language (Відкритий мову розмітки), а також специфікації [XML].
XML створювався як засіб відновлення сили і гнучкості SGML з одночасним позбавленням від складності. Будучи обмеженою формою SGML, XML, проте, зберігає більшу частину сили і багатства SGML і все широко використовувані можливості SGML.
Поєднуючи всі переваги, XML виключає багато найбільш складні функції SGML, що ускладнюють і здорожують процес створення документів і розробки відповідного програмного забезпечення.
Переваги переходу на XHTML 1.0 описані вище. Ось кілька основних переваг:
У цій версії XHTML надається визначення строго конформних документів XHTML, обмежених тегами і атрибутами простору імен XHTML. Інформацію про використання XHTML з іншими просторами імен, наприклад, для включення метаданих, виражених в RDF в документи XHTML, див. Розділ 3.1.2.
Строго конформний документ XHTML - це документ, яким необхідні тільки можливості, описані в цій специфікації як обов'язкові. Такий документ повинен відповідати всім наступним критеріям:
Він повинен проходити перевірку коректності відповідно до одним з трьох DTD, наведених в додатку A.
Кореневим елементом документа повинен бути елемент .
ось приклад мінімального документа XHTML.
Простір імен XHTML може використовуватися з іншими просторами XML відповідно до [XMLNAMES]. хоча такі документи не є строго конформними XHTML 1.0 відповідно до наведеного вище визначенням. У майбутніх роботах W3C будуть визначені способи вказівки конформності документів, в яких використовується кілька просторів імен.
в наступному прикладі показано, як XHTML 1.0 може використовуватися з рекомендацією MathML:
У наступному прикладі показаний спосіб впровадження розмітки XHTML 1.0 в інший простір імен XML:
Конформний призначений для користувача агент повинен відповідати всім наступним критеріям:
Процесор XML призводить коди кінця рядка, різні в різних в системах, в одному символу перекладу рядка, який передається в додаток. Призначений для користувача агент XHTML, крім того, повинен обробляти як пробільні такі символи:
- переклад сторінки (# x000C;)
- пробіл нульової ширини (# x200B;)
В елементах, в яких для атрибута 'xml: space' встановлено значення 'preserve', призначений для користувача агент повинен зберігати всі пробільні символи (за винятком початкових і кінцевих символів пробілів, які повинні вилучатися). В іншому випадку прогалини повинні оброблятися за такими правилами:
Прогалини в значеннях атрибутів обробляються відповідно до [XML].
Оскільки XHTML є додатком XML, деякі прийоми, допустимі в мові HTML 4 [HTML]. заснованому на SGML, повинні бути змінені.
Правильна побудова - це нове поняття, введене в [XML]. В основному це означає, що всі елементи або повинні мати відповідні завершальні теги, або записуватися в спеціальній формі (як описано нижче), і всі елементи повинні вкладатися один в одного.
Хоча в SGML перекриття неприпустимо, існуючі браузери зазвичай не вважають це помилкою.