Page 182 - 4511
P. 182
одну групу. У цих дендрограмах, вертикальна (або горизонта-
льна) вісь означає довжину звязку (linkage). Отже, для кожного
вузла у графа (де нова група сформована) ми можемо читати
відстань критерію, в якій відповідні елементи були пов'язані ра-
зом в новій єдиній групі. Коли дані містять ясну "структуру" в
термінах груп об'єктів, які подібні один до одного, потім ця
структура відбиватиметься в ієрархічному дереві як чіткі гілки.
Як результат успішного аналізу з методом приєднання, ми мо-
жемо виявити групи (гілки) і інтерпретувати їх.
Кластерний аналіз у рамках програми STATISTICA до-
зволяє обчислювати різні типи відстаней, крім того, користувач
може вичислити матрицю відстаней незалежно і використову-
вати її безпосередньо.
Міри відстані
Відстань Евкліда. Це, мабуть, найбільш загальний тип ві-
дстані. Воно просто є геометричною відстанню в багатовимір-
ному просторі і обчислюється таким чином:
2 1 2
d ( , )x y i i x i y i
i
Квадрат евклідова відстані. Іноді може виникнути ба-
жання звести в квадрат стандартну відстань Евкліда, щоб на-
дати великі ваги віддаленішим один від одного об'єктам. Ця ві-
дстань обчислюється таким чином:
2
d ( , )x y i i x i y i
i
Відстань міських кварталів (манхеттенска відстань).
Ця відстань є просто середньою абсолютних значень різниць по
координатах. В більшості випадків цей захід відстані призво-
дить до результатів таким же, як і для звичайної відстані Евк-
ліда. Проте відмітимо, що для цього заходу вплив окремих ве-
ликих різниць (викидів) зменшується (оскільки вони не зво-
дяться в квадрат). Манхэттенское відстань обчислюється за фо-
рмулою:
181