XML Введення

XML - це мова розмітки на зразок як HTML. Розшифровуэться як (англ. Extensible Markup Language -  Розширювана Мова Розмітки) і рекомендується суспільством W3C в якості мови розмітки загального застосування (W3C recommended). На відміну від інших мов розмітки, XML сам по собі не визначений (це означає, що ви самі повинні визначати теги, які використовуєте). Основним призначенням XML є  інформації між різноманітними системами (навіть концептуально різними), такими як інтернет.

Багато мов базуються на  XML; Деякі з них: XHTML, MathML, SVG, XUL, XBL, RSS, та RDF. Ви можете розробити свій.

"Корректний" XML (правильно сформований)

Правила оформлення

 

Для корректного XML докумунту повинні виконуватися наступні умови:

  • Правильне оформлення документу.
  • Повинні виконуватися усі синтаксичні правила XML.
  • Документ повинен відповідати семантичним правилам мови (які зазвичай вказані в схемі XML або DTD (англ. Document Type Definition)). 

 

Приклад

Приклад нижче демонструє документ з тегом, який не закриває сам себе і не має закриваючого тега (це неправильно оформлений XML документ).

<message>
    <warning>
        Hello World      
    <!--missing </warning> -->
</message>

Давайте подивимось на коректну версію цього документу:

<message>
    <warning>
         Hello World
    </warning>
</message>

Документ, який містить невизначений тег є не коректним. Наприклад, якщо ми не визначили тег <warning>, документ не коректен.

 

В більшість бразерів вбудован дебаггер, який може ідинтифікувати погано написаний XML документ.

Сутності

HTML та XML пропонують методи (які називають сутності) для звертання до спеціальних зарезервованих символів (наприклад: кутові дужки, які позначають початок і кінець тега). Існує п'ять сутностей, які ви обов'язково повинні знати:

Сутність Символ Опис
&lt; < Знак менше (одна з кутових дужок)
&gt; > Знак більше (одна з кутових дужок)
&amp; & Амперсанд
&quot; " Подвійна лапка
&apos; ' Одинарна лапка (апостроф)

Не дивлячись на те, що за замовчуванням створено усього п'ять сутностей, ви можете додати до документу свої сутності використовуючи Document Type Definition. Наприклад, створити нову &warning; сутність, можно так:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE body [
  <!ENTITY warning "Попередження: сталася помилка, оновіть і спробуте ще раз.">
]>
<body>
  <message> &warning; </message>
</body>

Також ви можете використовувати нумеричні посилання для специфічних спеціальних символів. Наприклад, &#xA9; - це символ "©".

Відображення XML

XML зазвичай використовують для опису чогось. Існують методи відображення XML даних, але якщо ви не визначили спосіб візуалізаціі XML документу, то в браузері він відобразиться построчно, як звичайний текстовий файл.

Один з методів відображення XML - вказати CSS (щоб використовувати в документі треба прописати інструкцію xml-stylesheet, як показно у прикладі нижче).

<?xml-stylesheet type="text/css" href="stylesheet.css"?>

Також існує багато потужних методів відображення XML, наприклад, XSLT(англ. Extensible Stylesheet Language Transformations), який може використовуватись для  перетворення XML в інші мови, як HTML. Це робить XML дуже універсальним.

<?xml-stylesheet type="text/xsl" href="transform.xsl"?>

Рекомендації

 

Ця стаття є маленьким введенням до XML, з дуже малою кількістю прикладів та посилань, щоб ви могли почати працювати з цією мовою. Щоб быльше дызнатися про XML, вам доведеться шукати інформацію та більш інформативні статті в інтернеті.

Вивчайте HTML (англ. HyperText Markup Language), знання HTML допоможе вам краще зрозуміти XML.

 

Дивіться також

Стаття Using XML - чудовий русурс із великою кількістю інформації про розробку своєї мови на основі XML.