Page 27 - 4611
P. 27
2.2 Елементи побудови інформаційно-пошукових систем
Пошук інформації – це процес відслідковування в деякій
системі зберігання інформації таких документів (текстів, запитів)
які відповідають запиту. У ролі таких засобів зберігання пошуку
інформації виступають інформаційно-пошукові системи,
елементами яких є структурований масив документів (база, дата,
підпис), що виступають об’єктом пошуку різних технологій
запиту, та інформаційно-пошукова мова.
При вводі документа в базу даних інформаційно-пошукової
системи його індексують. Процес індексації в основному полягає
у встановленні і виборі ключових слів оброблювальних
документів та вираження їх формальним способом у вигляді
пошукового образу. Процес пошуку відбувається зіставленням
образу запиту з тим, що зберігається у базі.
Виділяють такі характеристики інформаційного пошуку:
- повноту видачі інформації (ПВ);
- точність видачі (ТВ);
- втрата інформації (ВІ);
- інформаційний шум (ІШ).
Дані характеристики розглядають на основі наведеної
нижче таблиці
Таблиця 1 – характеристики інформаційних пошуків
Документ Релевантність Нерелевантність
Видані ІПС А В
Невидані ІПС С D
За позначеннями, що вводяться таблицею 1:
ПВ = а/(a+c) x 100 % ;
ВІ=с/(a+c)x 100% ;
ІШ=b/(a+b)x 100%;
ТВ=a/(a+b)x 100%.
Поняття релевантності є фундаментальним в теорії
інформаційного пошуку. Документ, центральний предмет або
тема якого в цілому відповідає змісту інформаційного запиту,
називається релевантним, а властивість значеннєвої близькості
між документом та інформаційним запитом – релевантністю.
27