Page 147 - 4785
P. 147
краще вони можуть бути витримані. Навіть у випадку розмітки вже
існуючого тексту може мати сенс визначити обмежує набір правил,
що відносяться до певного баченню тексту або гіпотезі, що
стосується тексту, - хоча б як засіб перевірки корисності цього
бачення або гіпотези. Важливо пам'ятати, що кожне визначення типу
документа є інтерпретацією тексту. Не існує єдиного DTD, що
охоплює всі відомості про текст, хоча може бути зручно віддавати
перевагу одні DTD іншим для конкретних типів аналізу.
В даний час SGML найширше застосовується там, де основною
вимогою є однаковість структури документів. Наприклад, при
виробництві технічної документації вельми важливо, щоб розділи та
підрозділи були відповідним чином вкладені, щоб перехресні
посилання були коректні, і так далі. У таких ситуаціях до документів
відносяться як з сирого матеріалу, до якого застосовується
заздалегідь визначений набір правил. Однак, як говорилося вище,
використання простих правил може також сильно спростити
завдання акуратною розмітки елементів і менш обмежених текстів.
Роблячи такі правила явними, дослідник зменшує свою роботу по
розмітці і перевірці електронного тексту, в той же час виявляючи
інтерпретацію структури і значущі особливості кодованого тексту.
Правила мінімізації
Друга частина опису задає правила мінімізації для елемента. Ці
правила визначають, чи зобов'язані бути присутніми відкриває і
закриває мітки для кожної появи даного елемента. Вони мають
вигляд пари символів, розділених пропуском, перший з яких
відноситься до відкриваючої, а другий - до закриває мітці. В обох
випадках повинні бути присутніми або мінус або буква O; мінус
означає, що мітка повинна бути присутня, а буква O - що вона може
бути опущена. Так, у нашому прикладі кожен елемент, окрім <line>,
повинен мати відкриває мітку. Тільки елементи <poem> і
<anthology> зобов'язані також мати і закриває мітку.
Модель вмісту
Третя частина кожного опису, укладена в круглі дужки,
називається моделлю вмісту елемента, тому що вона вказує, що
можуть містити екземпляри елемента. Вміст вказується або в
термінах інших елементів, або за допомогою спеціальних
зарезервованих слів. Є кілька таких зарезервованих слів, з яких саме
145