Page 58 - 4196
P. 58
1
r
1
d X k , X m d r ,x i x j , r .
n
k n m x i X x j X m
k
Після вибору міри попарної подібності організуєть-
ся процедура об’єднання подібних елементів в класи.
Найбільш поширені процедури послідовного об’єднання
спостережень у групи за принципом найбільшої контрас-
тності між окремими групами. Для цього задається кри-
тичне значення міри d . Об’єднання завершується, коли
kp
d X k , X m d kp . Процедури об’єднання, як правило, не
визначені однозначно. В деяких випадках фіксується де-
кілька значень d kp . Тоді кожному з них відповідає певна
класифікація. Іноді величина d kp вибирається таким чи-
ном, щоби виділити задану кількість класів.
Оптимізація процесу виділення класів можлива
шляхом введення в алгоритм міри якості (функціонала
якості) класифікації, яка може ґрунтуватися на мірах
міжгрупової подібності. «Кращим» рахується групуван-
ня, якому відповідає екстремальне значення функціоналу
якості.
Умовно можна виділити наступні типи процедур
побудови класів. Найпоширенішим є ієрархічний процес,
який реалізує послідовне об’єднання (роз’єднання) еле-
ментів у групи. Кожному кроку відповідає деяке групу-
вання ,...X 1 X r . Якщо на кожному кроці r збільшується,
то процес називається агломеративним, якщо r зменшу-
ється, то процес називається дивізимним. Якщо число
класів m попередньо відоме, то процес завершується при
досягненні числа m. При цьому, якщо одному і тому ж
m відповідає декілька класифікацій, вибирають класифі-
кацію за екстремальним значенням функціоналу якості.
При невідомому числу класів процес об’єднання завер-
шується при досягненні критичного значення d kp .
0 0 0
При наявності еталонних даних E E ,..., E ,
1 m
про належність деяких елементів до певних класів та ві-
58