Page 96 - 6299
P. 96
Ваговий критерій рубрики - це показник, за яким визначається, до якої рубрики
віднести дані. Значення вагового критерію даних може бути визначене в такий
спосіб:
де Р - вага даних, що визначає приналежність до конкретної рубрики;
S - вага джерела інформації;
К i - вага ключового слова, яке знайдене в документі;
mах (A k)- вага "визнаного" автора;
W z - вага посилання на інше джерело інформації;
р = 2, З,...
Коефіцієнти а, р, ф залежать від тематики та типу інформаційного
ресурсу. Всі чисельні значення ваг визначаються експертом під час побудови
ІАС, потім допрацьовуються при налаштуванні за рахунок аналізу результатів
автоматичної рубрикації. Діапазон значень кожної ваги визначається для
конкретного типу ІАС. Наприклад, для рубрикації змішаного веб-контенту
найбільш значущим буде внесок ключових слів, а для аналізу документів
Кабінету Міністрів порівняльний внесок ваги автора документа значно зростає.
В ідеалі, варіюючи коефіцієнти а, р, Ф можна настроїти структурування
інформації під конкретне прикладне завдання, міняючи значення параметра р,
можна виявити неточності побудови моделі у випадку виникнення різких
розбіжностей під час порівняння результатів структурування для різних р.
У разі структурування інформації в ІАС неминучим є створення
надлишкових метаданих. Це обумовлюється зручністю обробки не самої ін-
формації, а її метаданих. Узагальнюючи, можна сказати, що достатньо
вирішити складне завдання - створити набір метаданих - і згодом ці метадані
можуть бути багаторазово використані для різних задач. Особливо даний
підхід виправданий при вирішенні завдання з ведення аналітичної діяльності.
Необхідно підкреслити, що без здійснення аналізу семантичного значення
даних неможливо повноцінно створити метадані.
95