Page 93 - 6299
P. 93
логічному й семантичному. Тому для зручності виділимо в структуруванні
інформації такі складові: фізичне, логічне й семантичне структурування.
Під фізичним структуруванням будемо розуміти перетворення інформації
на рівні форматів даних (зведення різних форматів вхідних даних до виду,
зручного для обробки в ІАС); під логічним - розміщення даних в
інформаційному сховищі ІАС 1 знаходження їхнього місця в загальній ієрархи
даних (структуризація інформаційного ресурсу ІАС); під семантичним -
кластеризацію даних із урахуванням значеннєвого змісту інформації.
Таким чином, для ІАС структурованою будемо називати інформацію,
яка без додаткової корекції переміщується до баз даних (БД) ІАС і перебуває в
зручному та доступному для аналізу вигляді.
Для визначення задачі структурування виділимо ряд ознак, які
характеризують структуровану інформацію:
однаковий або легкозамінний формат даних (таблиця, вибірка, текст);
наявність додаткових даних для створення структури даних (індекси,
заголовки полів БД);
упорядкованість за якими-небудь критеріями (нумерація,
упорядкованість за часом);
наявність загальної ознаки в структурі всіх елементів.
Узагальнивши всі ознаки, будемо вважати особливістю структурованої
інформації можливість обробки й переміщення в БД даних, що надходять в
ІАС у різних форматах.
Число форматів даних постійно зростає, і ІАС повинна вміти працювати
з найрізноманітнішими типами даних. Але всередині самої ІАС підтримка
безлічі форматів накладає додаткові обмеження на обчислювальні потужності
й програмні інтерфейси. Тому система повинна перетворювати вхідні дані у
форматії, які підтримуються БД ІАС.
Створення додаткових даних, або метаданих - один 13 відомих
напрямків структурування інформації. Сам поділ на дані та метадані можна
92