Page 68 - 4431
P. 68
Отже, в більш або менш складному інформаційному виробництві
спостерігається технологічний ланцюжок операцій присвоєння складного ключа
документу, формування масиву прецедентів, організованого за складним ключем,
формування складного ключа за змістом запиту, пошук релевантних складному ключу
документів. Зауважимо, що у такому ланцюжку присутній елемент так званого
“штучного інтелекту” – процедура ознайомлення фахівця з усіма прецедентами масиву
замінюється на процедуру формального пошуку за складним ключем.
Аналогічні стадії розвитку можна спостерігати в будь-якому інформаційному
виробництві, що досягло рівня штучного інтелекту. Автоматичний переклад з однієї
мови на іншу починався з підрядкового перекладу, де застосовувався пошук за простим
унікальним ключем в однослівному словнику. Автоматичний композитор починався з
автоматичного пошуку і відтворення музичних фраз за фіксованим набором нот тощо.
Формування масивів записів і документів, або баз даних, для пошуку
прецедентів в інформаційному виробництві проводиться також шляхом порівняння
ключів нових документів, що породжуються в даному або в суміжних інформаційних
виробництвах, з ключами інтересів, функціональних обов’язків, предметних областей
та інших атрибутів, притаманних відповідному інформаційному виробництву.
Найпоширенішою формою комплектування баз даних є відбір з нових документів
за унікальним ключем документів, потрібних даному інформаційному виробництву. До
такої форми комплектування належить передплата на видання різного виду за їх
найменуванням і/або унікальними класифікаційними індексами. Деякі види нових
документів (наприклад, нормативно-розпорядчі), направляються в бази даних
інформаційних виробництв примусово, за принципом “усім, усім, усім”, що також можна
вважати передплатою.
Іншою формою комплектування баз даних є відбір за складним ключем
документів з доступного потоку нових документів. Ця форма має два різновиди
поширення (розподілу) інформації: внутрішнє і зовнішнє вибіркове. Перший різновид
використовується інформаційним виробництвом, що формує базу прецедентів з
власних інформаційних продуктів і/або із загальнодоступних джерел інформації
(наприклад, із засобів масової інформації), а другий використовується зовнішнім
інформаційним виробництвом, зацікавленим у розширенні споживання своїх
інформаційних продуктів з економічних, політичних та інших міркувань.
За наявності доступних зовнішніх баз даних доводиться вирішувати задачу
оптимального управління формуванням власних баз даних із зовнішніх джерел з
урахуванням інтенсивності використання у виробництві відповідних даних. Може
виявитися вигідним не комплектувати свою базу зовнішніми даними у запас за допомогою
процедури виборчого поширення інформації, а за потреби застосовувати процедури
пошуку прецедентів у зовнішніх базах даних. Унаслідок закону старіння отримані за
запитом релевантні дані можна вважати новими і включати їх у власні оперативні
інформаційні ресурси. Цю процедуру формування баз даних природно назвати
комплектуванням за запитами до зовнішніх баз даних.
У разі комплектування інформаційних ресурсів із зовнішніх баз даних можна
кількісно оцінити корисність тієї або іншої БД для даного виробництва через прямий
підрахунок кількості документів, релевантних запитам, що надійшли з відповідної БД.
Отримане число можна назвати індексом цитування бази даних в інформаційному
ресурсі. Аналогічно можна визначити індекси цитування будь-яких джерел інформації,
використовуваних для комплектування інформаційного ресурсу шляхом відбору за
простим або складним ключем.
Індекси цитування дають змогу вирішувати задачу оптимального
комплектування інформаційних ресурсів. Наприклад, ранжування за індексом
цитування журналів, що публікують статті за профілем даного інформаційного
68