Page 24 - 6092
P. 24

  пошук за допомогою пошукових машин;
                    пошук за допомогою форумів, конференцій, чатів, блогів.
                  Але перш ніж більш докладно розглянути ці технології, слід ознайомитись з
            структурою інформаційного простору інтернет.

                                 2.6.2 Cтруктура інформаційного простору інтернет

                  Для ефективного пошуку в необхідно враховувати архітектуру всього інформаційного
            простору  інтернет.  Гіперпосилання  можуть  стати  основою  для  побудови  моделі  web-
            простору. Ця модель була вперше створена в 1999 році в Інституті пошуку та аналізу текстів
            (США).  Модель  спростувала  уявлення  про  інтернет  як  про  єдиний  густий  простір.
            Дослідивши  за  допомогою  пошукового  механізму  200  млн.  web-сторінок  та  декілька
            міліардів  посилань,  вчені  прийшли  до  висновку  про  неоднорідну  структуру  інтернету  та
            створили топологічну модель, близьку до моделі Bow Tie (краватка-метелик) (рис.2.1)


































                                         Рисунок 2.1 – модель web-простору

                  Розгялнемо  докладніше  основні  елементи  цієї  моделі.  Центральне  ядро  містить  28%
            web-сторінок.  Воно  складається  з  компонентів  сильної  зв’язності  (SCC).  До  нього
            відносяться web-сторінки, пов’язані так тісно, що, переходячи за гіперпосиланнями, з будь-
            якої з них в можна потрапити на будь-яку іншу. «Початкові» web-сторінки складають 22%.
            Це  Web-сторінки,  які  містять  гіперпосилання,  що  ведуть  до  ядра.  Але  з  ядра  за
            гіперпосиланнями  на  них  потрапити  не  можна.  «Кінцеві»  web-сторінки    також  складають
            22%. До них можна прийти за посиланнями з ядра. Але повернутися за гіперпосиланнями
            назад  до  ядра  з цих  сторінок  не  можливо.  «Відростки»  складають  22%.  Це  Web-сторінки,
            повністю  изольовані  від  центрального  ядра.  Це  або  «відростки»,  пов’язані  в
            односторонньому порядку зі  сторінками  іншої  категорії  або   «перешийки», що поєднують
            web-сторінки,  які  не  входять  до  ядра.  До  «островів»  належить  біло  10%  web-сторінок.  Це
            web-сторінки,  які  взагалі  не  перетинаються  з  рештою  ресурсів  інтернету.  Єдиний  спосіб
            знайти ці сторінки – знати їх адресу. Жодні пошукові машини не можуть знайти «острови»,
            якщо на них не ведут гіперпосилання.


                                                                                                          23
   19   20   21   22   23   24   25   26   27   28   29