Page 185 - 4511
P. 185
того, що при обчисленнях розмір відповідних кластерів (тобто
число об'єктів, що містяться в них) використовується як ваго-
вий коефіцієнт. Тому пропонований метод має бути використа-
ний (швидше навіть, чим попередній), коли передбачаються не-
рівні розміри кластерів.
Незважений центроїдний метод (UPGMC). У цьому
методі відстань між двома кластерами визначається як відстань
між їх центрами тяжіння.
Зважений центроїдний метод (медіана). Цей метод іде-
нтичний попередньому, за винятком того, що при обчисленнях
використовуються ваги для обліку різниці між розмірами клас-
терів (тобто числами об'єктів в них). Тому, якщо є (чи підозрю-
ються) значні відмінності в розмірах кластерів, цей метод вияв-
ляється прийнятніше за попереднє.
Метод Варда. Цей метод відрізняється від усіх інших ме-
тодів, оскільки він використовує методи дисперсійного аналізу
для оцінки відстаней між кластерами. Метод мінімізує суму
квадратів (SS) для будь-яких двох (гіпотетичних) кластерів, які
можуть бути сформовані на кожному кроці. В цілому метод
представляється дуже ефективним, проте, він прагне створю-
вати кластери малого розміру.
Двувходове об'єднання. Виявляється, що кластеризація,
як за спостереженнями, так і по змінних може привести до до-
сить цікавих результатів. Двостороннє з'єднання корисне в об-
ставинах, коли ми чекаємо, що як випадки, так і змінні одноча-
сно сприятимуть розкриттю значимих зразків груп.
Модуль Кластерний аналіз містить ефективну двувходо-
вую процедуру об'єднання, що дозволяє зробити саме це. Проте
двувходовое об'єднання використовується (відносно рідко) в
обставинах, коли очікується, що і спостереження і змінні одно-
часно вносять вклад до виявлення осмислених кластерів.
Трудність з інтерпретацією отриманих результатів вини-
кає внаслідок того, що схожість між різними кластерами може
походити з (чи бути причиною) деякої відмінності підмножин
змінних. Кластери, що виходять, є за своєю природою неодно-
рідними, що ускладнює інтерпретацію. Порівняно з іншими
описаними методами кластерного аналізу (див. Об'єднання (де-
ревовидна кластеризація і Кластеризація методом К - серед-
ніх), двувходовое об'єднання являється, ймовірно, найменш ви-
користовуваним методом. Проте деякі дослідники вважають,
184