Page 186 - 4511
P. 186
що він пропонує потужний засіб пояснювального аналізу да-
них.
Розглянемо приклад застосування двувходовую проце-
дури об'єднання, яка дала наступні результати
Очевидно,що наведена двовимірна дендрограма є резуль-
татом факту впливу декількох різних підмножин змінних на пі-
дмножини об'єктів. Отже, результуюча структура (групи) є не-
однорідною природою.
Метод К середніх. Цей метод кластеризації істотно відрі-
зняється від агломеративных методів Об'єднання (деревовидна
кластеризація) і Двувходовое об'єднання. Припустимо, ви вже
маєте гіпотези відносно числа кластерів (за спостереженнями
або по змінних). Ви можете вказати системі утворити рівно три
кластери так, щоб вони були настільки різні, наскільки це мож-
ливо. У загальному випадку метод К середніх будує рівно К рі-
зних кластерів, розташованих на можливо великих відстанях
один від одного.
З обчислювальної точки зору можна розглядати цей метод
як дисперсійний аналіз (ANOVA) "навпаки". Програма починає
з К випадково вибраних кластерів, а потім змінює приналеж-
ність об'єктів до них, щоб:
185