Page 143 - 4785
P. 143
SGML надає множину варіантів синтаксичної розмітки для
використання різними прикладними програмами. Змінюючи SGML
Declaration можна навіть відмовитись від використання кутових
дужок, хоча, цей синтаксис вважається стандартним, так званим
concrete reference syntax.
Приклад SGML синтаксису:
<QUOTE TYPE="example">
typically something like <ITALICS>this</ITALICS>
</QUOTE>
SGML це стандарт ISO «ISO 8879:1986 Information
processing—Text and office systems—Standard Generalized Markup
Language (SGML)»
Як HTML, так і XML похідні від SGML. HTML це деяка прикладна
програма (застосування) на SGML, а XML це підмножина SGML,
розроблена для спрощення процесу машинного розбору документа.
Іншими прикладними програмами на SGML є SGML
Docbook (документування), і «Z Format» (типографія та
документування).
SGML вводить поняття типу документа і, як наслідок,
визначення типу документа (document type definition, DTD). Тип
документа формально визначається його складовими частинами та
їх структурою. Наприклад, визначення звіту може констатувати, що
він складається з заголовка, можливо, автора, за яким слідують
анотація та один або кілька абзаців. Все, що не має заголовка,
відповідно до цього формальним визначенням, звітом не є, так само,
як не є ним послідовність абзаців, за якою слідує анотація,
незалежно від того, наскільки такі документи схожі на звіт для
читача-людини.
Раз документи мають відомі типи, можна використовувати
спеціальну програму, що називається аналізатором (parser), для
перевірки документа, який стверджує свою приналежність певному
типу. Аналізатор перевіряє, що всі елементи, необхідні типом
документа, насправді присутні і розташовані в правильному
порядку. Що більш важливо, різні документи одного і того ж типу
можуть оброблятися однаковим чином. Можна конструювати
програми, що використовують знання структури документа, які,
таким чином, можуть діяти в більш осмисленою манері.
141