Page 185 - 4511
P. 185

того, що при обчисленнях розмір відповідних кластерів (тобто
           число об'єктів, що містяться в них) використовується як ваго-
           вий коефіцієнт. Тому пропонований метод має бути використа-
           ний (швидше навіть, чим попередній), коли передбачаються не-
           рівні розміри кластерів.
                Незважений  центроїдний  метод  (UPGMC).  У  цьому
           методі відстань між двома кластерами визначається як відстань
           між їх центрами тяжіння.
                Зважений центроїдний метод (медіана). Цей метод іде-
           нтичний попередньому, за винятком того, що при обчисленнях
           використовуються ваги для обліку різниці між розмірами клас-
           терів (тобто числами об'єктів в них). Тому, якщо є (чи підозрю-
           ються) значні відмінності в розмірах кластерів, цей метод вияв-
           ляється прийнятніше за попереднє.
                Метод Варда. Цей метод відрізняється від усіх інших ме-
           тодів, оскільки він використовує методи дисперсійного аналізу
           для  оцінки  відстаней  між  кластерами.  Метод  мінімізує  суму
           квадратів (SS) для будь-яких двох (гіпотетичних) кластерів, які
           можуть  бути  сформовані  на  кожному  кроці.  В  цілому  метод
           представляється дуже ефективним, проте, він прагне створю-
           вати кластери малого розміру.
                Двувходове  об'єднання.  Виявляється,  що  кластеризація,
           як за спостереженнями, так і по змінних може привести до до-
           сить цікавих результатів. Двостороннє з'єднання корисне в  об-
           ставинах, коли ми чекаємо, що як випадки, так і змінні одноча-
           сно сприятимуть розкриттю значимих зразків груп.
                Модуль Кластерний аналіз містить ефективну двувходо-
           вую процедуру об'єднання, що дозволяє зробити саме це. Проте
           двувходовое  об'єднання  використовується  (відносно  рідко)  в
           обставинах, коли очікується, що і спостереження і змінні одно-
           часно вносять вклад до виявлення осмислених кластерів.
                Трудність з інтерпретацією отриманих результатів вини-
           кає внаслідок того, що схожість між різними кластерами може
           походити з (чи бути причиною) деякої відмінності підмножин
           змінних. Кластери, що виходять, є за своєю природою неодно-
           рідними,  що  ускладнює  інтерпретацію.    Порівняно  з іншими
           описаними методами кластерного аналізу (див. Об'єднання (де-
           ревовидна кластеризація і Кластеризація методом К - серед-
           ніх), двувходовое об'єднання являється, ймовірно, найменш ви-
           користовуваним  методом.  Проте  деякі  дослідники  вважають,

                                            184
   180   181   182   183   184   185   186   187   188   189   190