Page 59 - 4196
P. 59

домим  числом  класів  m,  використовується  процедура
           приєднання  елементів  до  еталонів  за  принципом  «най-
           ближчого» еталона.
                 Послідовне  покращення  класифікації  можливе  та-
           ким переміщенням окремих елементів із класу в клас, яке
           веде до покращення функціоналу якості.
                 Для наочності процес послідовного групування ві-
           дображають  графічно  на  дендрограмі,  де  по  вертикалі
           відкладаються відстані (міри подібності), а по горизонта-
           лі – номери об’єктів.
                 Існує  багато  алгоритмів,  реалізуючих  кластер  –
           аналіз. Для прикладу, розглянемо один із них, ілюструю-
           чи ієрархічну процедуру побудови класів.
                                                                    p
                 Нехай задана мішана вибірка   ,...,x 1  x n  , де  x   -
           вимірні  нормовані  вектори  спостережень  ( p   -  число
           ознак).  Процедура  попереднього  нормування  спостере-
           жень дозволяє звести ознаки до одного масштабу.
                 За  міру  подібності   ,xd  i  x  j   між  елементами  при-
           ймемо евклідову відстань між ними:
                                       p            2
                                     
                            d  ,x i  x  j    x  r   x  r   .
                                                 j
                                           i
                                       r 1
           Міру подібності множин (груп) визначимо за формулою
                           k   1  k   1    k   k
                       d  X  e  ,  X m   a  d  X  e  ,  X  m  

                                k   k        k   k
                          b  d  X e  ,  X q   c  d  X q  ,  X m  ,
           де
                   n   n             n   n q               n
                                       e
             a     e    m    ,  b             ,  c        e      .
                 n  n m    n q    n  n  m    n q    n  n m    n q
                                     e
                  e
                                                         e
           Множину  X   k   1   із індексом  k   на  k   - кроці ал-
                                                           1
                                                 1
                        m
           горитму отримують об’єднання двох множин із індексом
            k , які мають мінімальну відстань із усіх можливих пар
                               X  k  U  X  k    X k   1
                                 m
                                               m
                                        q
           і за формулою
                                        59
   54   55   56   57   58   59   60   61   62   63   64