Page 183 - 4511
P. 183
d ( , )x y i i x i y i
i
Відстань Чєбишева. Ця відстань може виявитися корис-
ною, коли бажають визначити два об'єкти як "різні", якщо вони
розрізняються по якій-небудь одній координаті (яким-небудь
одним виміром). Відстань Чєбишева обчислюється за форму-
лою:
d ( , ) maxx y i i x i y
i
Степінна відстань. Іноді бажають прогресивно збіль-
шити або зменшити вагу, що відноситься до розмірності, для
якої відповідні об'єкти сильно відрізняються. Це може бути до-
сягнуто з використанням степінної відстані. Степінна відстань
обчислюється за формулою:
p 1 r
d ( , )x y x y i
i i i i
де r і р - параметри, визначувані користувачем.
Параметр р відповідальний за поступове зважування різ-
ниць по окремих координатах, параметр r відповідальний за
прогресивне зважування великих відстаней між об'єктами.
Якщо r і р обоє рівні двом, то ця відстань співпадає з відстанню
Евкліда.
Відсоток незгоди. Ця міра використовується в тих випа-
дках, коли дані є категоріальними. Ця відстань обчислюється за
формулою:
d ( , )x y числоx y i i
i
i
i
У рамкках програми STATISTICA користувач може клас-
теризувати спостереження, змінні або і ті і інші разом з допо-
могою наступного набору мір відстані: евклідове, квадрат евк-
лідової, манхеттенске, Чєбишева, степінної відстаней, відсо-
тка незгоди, коефіцієнтів кореляції Пірсона.
Правила об'єднання або зв'язку
На першому кроці, коли кожен об'єкт є окремим класте-
ром, відстані між цими об'єктами визначаються вибраною мі-
рою. Проте коли зв'язуються разом декілька об'єктів, виникає
182