Page 59 - 4196
P. 59
домим числом класів m, використовується процедура
приєднання елементів до еталонів за принципом «най-
ближчого» еталона.
Послідовне покращення класифікації можливе та-
ким переміщенням окремих елементів із класу в клас, яке
веде до покращення функціоналу якості.
Для наочності процес послідовного групування ві-
дображають графічно на дендрограмі, де по вертикалі
відкладаються відстані (міри подібності), а по горизонта-
лі – номери об’єктів.
Існує багато алгоритмів, реалізуючих кластер –
аналіз. Для прикладу, розглянемо один із них, ілюструю-
чи ієрархічну процедуру побудови класів.
p
Нехай задана мішана вибірка ,...,x 1 x n , де x -
вимірні нормовані вектори спостережень ( p - число
ознак). Процедура попереднього нормування спостере-
жень дозволяє звести ознаки до одного масштабу.
За міру подібності ,xd i x j між елементами при-
ймемо евклідову відстань між ними:
p 2
d ,x i x j x r x r .
j
i
r 1
Міру подібності множин (груп) визначимо за формулою
k 1 k 1 k k
d X e , X m a d X e , X m
k k k k
b d X e , X q c d X q , X m ,
де
n n n n q n
e
a e m , b , c e .
n n m n q n n m n q n n m n q
e
e
e
Множину X k 1 із індексом k на k - кроці ал-
1
1
m
горитму отримують об’єднання двох множин із індексом
k , які мають мінімальну відстань із усіх можливих пар
X k U X k X k 1
m
m
q
і за формулою
59