Page 24 - 6092
P. 24
пошук за допомогою пошукових машин;
пошук за допомогою форумів, конференцій, чатів, блогів.
Але перш ніж більш докладно розглянути ці технології, слід ознайомитись з
структурою інформаційного простору інтернет.
2.6.2 Cтруктура інформаційного простору інтернет
Для ефективного пошуку в необхідно враховувати архітектуру всього інформаційного
простору інтернет. Гіперпосилання можуть стати основою для побудови моделі web-
простору. Ця модель була вперше створена в 1999 році в Інституті пошуку та аналізу текстів
(США). Модель спростувала уявлення про інтернет як про єдиний густий простір.
Дослідивши за допомогою пошукового механізму 200 млн. web-сторінок та декілька
міліардів посилань, вчені прийшли до висновку про неоднорідну структуру інтернету та
створили топологічну модель, близьку до моделі Bow Tie (краватка-метелик) (рис.2.1)
Рисунок 2.1 – модель web-простору
Розгялнемо докладніше основні елементи цієї моделі. Центральне ядро містить 28%
web-сторінок. Воно складається з компонентів сильної зв’язності (SCC). До нього
відносяться web-сторінки, пов’язані так тісно, що, переходячи за гіперпосиланнями, з будь-
якої з них в можна потрапити на будь-яку іншу. «Початкові» web-сторінки складають 22%.
Це Web-сторінки, які містять гіперпосилання, що ведуть до ядра. Але з ядра за
гіперпосиланнями на них потрапити не можна. «Кінцеві» web-сторінки також складають
22%. До них можна прийти за посиланнями з ядра. Але повернутися за гіперпосиланнями
назад до ядра з цих сторінок не можливо. «Відростки» складають 22%. Це Web-сторінки,
повністю изольовані від центрального ядра. Це або «відростки», пов’язані в
односторонньому порядку зі сторінками іншої категорії або «перешийки», що поєднують
web-сторінки, які не входять до ядра. До «островів» належить біло 10% web-сторінок. Це
web-сторінки, які взагалі не перетинаються з рештою ресурсів інтернету. Єдиний спосіб
знайти ці сторінки – знати їх адресу. Жодні пошукові машини не можуть знайти «острови»,
якщо на них не ведут гіперпосилання.
23