Page 72 - 4268
P. 72
класифікацію для змінних всіх змінних, окрім x. Послідовність
дій аналогічна попередньому аналізу. Результат кластеризації
наведений у вигляді дендрограми на Рис.15.
Рис.7.15. Вертикальна Дендрограмма деревоподібної класифікації
для змінних y, factor1, factor2
Висота великих гілок отриманої деревоподібної діаграми
залишилася колишньою, в той час як висоти скупчень гілок
зменшилися. Отже, при даній комбінації змінних внутрікласові
відмінності стали значно менше, у той час як відстані між
кластерами залишилися колишніми. Значить, у відсутності
змінної x ми отримали більш якісну кластеризацію в рамках
згаданих вище критеріїв.
На питання про кількість кластерів ми відповіли, їх 4. Тепер
необхідно з'ясувати, який об'єкт, до якого кластеру належить. Для
цього скористаємося ітеративної процедурою, методом к-
середніх. Суть методу полягає в тому, що процес класифікації
починається з завдання початкових умов. У нашому випадку це
кількість утворюваних кластерів та центри цих кластерів. Далі,
кожне багатовимірне спостереження сукупності ставиться до
того кластеру, центр якого ближче всіх до цього спостереження.
Потім виконується перевірка на стійкість класифікації. Якщо
класифікація стійка, процес зупиняється. В іншому випадку,
відбувається чергова процедура розбиття об'єктів по кластерах.
Виконаємо метод K-середніх на стандартизованих даних. Для
цього скористаємося командами меню Statistics - Multivariate
Exploratory Techniques - Cluster Analysis - Аналіз - Багатомірний
розвідувальний аналіз - Кластерний аналіз. У діалоговому вікні
72