Page 71 - 4268
P. 71
Для продовження аналізу натиснемо ОК. У діалоговому вікні
результатів об'єднання скасуємо опцію Rectangular Branches -
Прямокутні гілки і натиснемо кнопку Vertical icicle plot -
Вертикальна Дендрограмма. Результат побудови графіка
представлений на Рис.7.14.
Рисунок 7.14 – Вертикальна Дендрограмма деревоподібної
класифікації для змінних x, y, factor1, factor2.
Як вже згадувалося раніше, деревоподібна діаграма відображає
історію об'єднання об'єктів в кластери. Чим вище гілки дерева -
графа, тим пізніше об'єкти були об'єднані. На представленому
Рис.14 чітко виділяються чотири гілки дерева, об'єднані на
однаковій висоті. Кожна з цих гілок має продовження у вигляді
скупчень гілок набагато меншої висоти, ще званих купчастості.
Причому, структура скупчень не має яскраво вираженою
ієрархією.
Таким чином, можна стверджувати, що все безліч даних
добре розділяється на чотири кластери. Варто зазначити, що
даний графік добре ілюструє досягнення поставлених нами цілей
про однорідність даних усередині кластера і максимальної
віддаленості самих кластерів. Дійсно, гілки всередині кожного з
скупчень мають приблизно однакову висоту, при цьому висоти
великих гілок, які об'єднують виділені кластери, значно
перевищують висоти малих гілок - представників кластерів.
Природне прагнення - виявити якомога меншу кількість
змінних, "відповідальних" за кластеризацію. Чим менше змінних
залучено в процес розбиття даних на кластери, тим більше шансів
зрозуміти фізичний зміст даного розбиття. Проведемо ієрархічну
71