Page 28 - 6859
P. 28
сайти, збирають відомості про вміст сторінок, тобто індексують
їх і наповнюють бази даних пошукової системи.
Щоб скористатися пошуковою системою потрібно завантажити
її веб-сторінку і сформувати запит, за яким відбувається відбір
документів з розподіленої бази даних, що зберігається на серверах в
Інтернеті. Запит формується за допомогою ключових слів (одного
або кількох). Результати пошуку видаються користувачу у вигляді
переліку адрес сторінок (гіперпосилань) і короткої анотації до них.
Пошук - це процедура відбору потрібних документів, що
зберігаються в Інтернеті. Пошук здійснюється або автоматично за
допомогою ключових слів, або шляхом послідовного проходження
користувачем по рубриках в каталогах.
Ключове слово - це будь-яка лексична одиниця природної мови,
яка найбільшою мірою відображає зміст шуканого документа. При
формуванні запиту можуть використовуватися не лише окремі
ключові слова, але і словосполучення, що складаються з кількох
ключових слів.
Запит - це набір ключових слів, за допомогою яких пошукова
система автоматично проводить пошук і відбір необхідних
документів. Іншими словами, запит - це інструкція (команда) для
пошукової системи на пошук потрібних документів.
Запити бувають двох типів: прості і складні (або розширені,
advanced). Прості запити складаються з окремих ключових слів або
словосполучень. Складні запити, окрім ключових слів, містять
логічні чи інші оператори.
Індексація - це процедура автоматичного заповнення бази
даних пошукової системи, в якій зберігаються короткий зміст та
анотації до сторінок і доменні адреси, за якими розміщені сторінки.
Коли пошукова система отримує конкретний запит на пошук
потрібної інформації, то її пошуковий механізм порівнює ключові
слова, що введені користувачем, з ключовими словами, що
отримані під час індексації і збережені в базі даних системи. При
збіганні цих слів користувачу видається назва сторінки, короткий
опис, або абзац, де зустрічаються пошукові слова і доменна адреса
даної сторінки.
Сучасні пошукові системи постійно вдосконалюють свої
алгоритми роботи, і прагнуть проводити індексацію всього
документа, а не лише його назви чи перших абзаців тексту.
Найбільш досконалі роботи при індексації сканують і головну
сторінку і решту сторінок, заходячи за гіперпосиланнями вглиб
сайту. Попередня індексація документів Інтернету дозволяє згодом
за кілька секунд обслуговування запиту обробити (відсортувати)
гігабайти різноманітної інформації. За допомогою механізму
27