Page 186 - 4511
P. 186

що він пропонує потужний засіб пояснювального аналізу да-
           них.
                Розглянемо  приклад  застосування  двувходовую  проце-
           дури об'єднання, яка дала наступні результати


























                Очевидно,що наведена двовимірна дендрограма є резуль-
           татом факту впливу  декількох різних підмножин змінних на пі-
           дмножини об'єктів. Отже, результуюча структура (групи) є не-
           однорідною природою.
                Метод К середніх. Цей метод кластеризації істотно відрі-
           зняється від агломеративных методів Об'єднання (деревовидна
           кластеризація) і Двувходовое об'єднання. Припустимо, ви вже
           маєте гіпотези відносно числа кластерів (за спостереженнями
           або по змінних). Ви можете вказати системі утворити рівно три
           кластери так, щоб вони були настільки різні, наскільки це мож-
           ливо. У загальному випадку метод К середніх будує рівно К рі-
           зних  кластерів,  розташованих  на  можливо  великих  відстанях
           один від одного.
                З обчислювальної точки зору можна розглядати цей метод
           як дисперсійний аналіз (ANOVA) "навпаки". Програма починає
           з К випадково вибраних кластерів, а потім змінює приналеж-
           ність об'єктів до них, щоб:

                                            185
   181   182   183   184   185   186   187   188   189   190   191