Page 113 - 4144
P. 113

112


                      6.5 Пошуковий сервіс в Інтернет

                      6.5.1 Складові пошукових систем
                      Сучасний Інтернет представляє унікальне безмежне сховище знань,
               де  можна  отримати  відповідь  практично  на  будь-яке  питання.  Фактично,
               тут зібрано все краще, що винайдено і створено людством як за всю його
               довгу історію, а також новинки, що з'явилися щойно.
                      Проте  поява  такої  величезної  і  об’ємної  бібліотеки  не  може  не
               привести  до  перевантаженості  інформаційного  простору.  Фахівці  по-
               різному  оцінюють  розміри  Інтернету,  проте  в  більшості  сходяться  на
               думці,  що  зараз  тут  знаходяться  мільярди  сторінок,  причому  велика
               частина їх зникає або оновлюється протягом нетривалого періоду часу. Чи
               існує  яка-небудь  можливість  орієнтуватися  в  цьому  практично
               нескінченному невичерпному швидкозмінному потоці інформації?

                      Частково  цю  проблему  вирішують  спеціальні  інформаційно-
               пошукові  системи,  які  вміють  самостійно  збирати  інформацію.  Якщо
               розумно  використати  пошукову  систему,  можна  на  протязі  достатньо
               короткого  часу  знайти  інформацію,  на  пошук  якої  без  використання
               Інтернет можна витратити місяці і навіть роки. Але, практика доводить, що
               зараз ефективно і правильно використовувати пошукові системи вміють не
               більше 3% чоловік і в результаті на запит з 1-2 слів отримують абсолютно
               даремну для себе інформацію.
                      Пошукові cистеми зазвичай мають три компоненти:
                      1.     агент  (павук,  кроулер  або  робот),  який  переміщується  по
               мережі і збирає інформацію;
                      2.     база даних, яка містить інформацію, що зібрано павуками;
                      3.     пошуковий  механізм,  який  користувачі  використовують  як
               інтерфейс для взаємодії з базою даних.
                             Засоби  пошуку  типу  агентів,  павуків,  кроулерів  і  роботів
               використовуються для збору інформації про документи, які знаходяться в
               мережі  Інтернет.  Це  спеціальні  програми,  які  займаються  пошуком
               сторінок  в  мережі,  збирають  гіпертекстові  посилання  з  цих  сторінок  і
               автоматично  індексують  інформацію,  яку  вони  знаходять  для  побудови
               бази даних. Кожний пошуковий механізм має власний набір правил, якими
               визначається збір документів.
                      Агенти є найінтелектуальнішими з пошукових засобів. Вони можуть
               робити більше, ніж просто шукати: вони можуть виконувати транзакції від
               імені  користувача.  Вже  зараз  вони  можуть  шукати  сайти  специфічної
               тематики  і  повертати  списки  сайтів,  відсортованих  за  їх  відвідуваністю.
               Агенти можуть обробляти вміст документів, знаходити та індексувати інші
               види  ресурсів,  не  лише  сторінки.  Вони  можуть  бути  запрограмовані  для
               витягання інформації з вже існуючих баз даних. Незалежно від інформації,
   108   109   110   111   112   113   114   115   116   117   118