Page 70 - 4268
P. 70
Сутність даного методу полягає в тому, що на першому кроці
кожен об'єкт вибірки розглядається як окремий кластер. Процес
об'єднання відбувається послідовно: на підставі матриці
відстаней об'єднуються найбільш близькі об'єкти. Якщо матриця
подібності спочатку має розмірність mxm, то повністю процес
кластеризації завершується за m-1 кроків, в результаті всі об'єкти
будуть об'єднані в один кластер. Послідовність об'єднання легко
піддається геометричної інтерпретації і може бути представлена у
вигляді графа - дерева (дендрограми). На осі абсцис дендрограми
відкладаються імена спостережень, а по осі ординат, - відстань
об'єднання спостережень у кластери. Відповідно, чим вище
розташована гілку дерева на дендрограмм, тим пізніше було
проведено об'єднання об'єктів.
Проведемо ієрархічних кластерний аналіз на
стандартизованих даних. Для цього скористаємося командами
меню Statistics - Multivariate Exploratory Techniques - Cluster
Analysis - Аналіз - Багатомірний розвідувальний аналіз -
Кластерний аналіз. У діалоговому вікні Clustering method -
Методи кластеризації виберемо Joining (tree clustering) -
ієрархічна класифікація і натиснемо ОК. У діалоговому вікні
Cluster Analysis: Joining (Tree Clustering) - Кластерний аналіз:
ієрархічна класифікація виберемо вкладку Advanced - Додатково.
В якості змінних для аналізу виберемо x, y, Factor1, Factor2. У
розділі Cluster - Об'єкти виберемо Cases (Rows) - Спостереження
(рядки). В якості міри подібності в розділі Distance measure -
Міра близькості вкажемо Euclidian distances - Евклідів відстань.
Інші параметри залишимо за умовчанням. Вид діалогового вікна з
усіма потрібними установками представлений на Рис.7.13.
Рисунок.7.13 – Діалогове вікно завдання параметрів ієрархічної
класифікації.
70