Page 179 - 4511
P. 179

падках фіксується декілька значень d . Тоді кожному з них ві-
                                                 kp
           дповідає певна класифікація. Іноді величина  d  вибирається
                                                            kp
           таким чином, щоби виділити задану кількість класів.
                Оптимізація процесу виділення класів можлива шляхом
           введення в алгоритм міри якості (функціонала якості) класифі-
           кації, яка може ґрунтуватися на мірах між групової подібності.
           «Кращим»  рахується групування, якому  відповідає  екстрема-
           льне значення функціоналу якості.
                Умовно  можна  виділити  наступні  типи  процедур  побу-
           дови класів. Найпоширенішим є ієрархічний процес, який реа-
           лізує послідовне об’єднання (роз’єднання) елементів у групи.
           Кожному кроку відповідає деяке групування  ,...X 1  X r . Якщо
           на кожному кроці  r збільшується, то процес називається агло-

           меративним, якщо r  зменшується, то процес називається диві-
           зимним. Якщо число класів  m попередньо відоме, то процес за-
           вершується при досягненні числа m. При цьому, якщо одному і

           тому ж m відповідає декілька класифікацій, вибирають класи-
           фікацію за екстремальним значенням функціоналу якості. При
           невідомому числу класів процес об’єднання завершується при
           досягненні критичного значення d .
                                              kp
                При наявності еталонних даних  E      0    E 1   0  ,..., E   0  , про
                                                                   m
           належність деяких елементів до певних класів та відомим чис-
           лом класів m, використовується процедура приєднання елеме-
           нтів до еталонів за принципом «найближчого» еталона.
                Послідовне покращення класифікації можливе таким пе-
           реміщенням окремих елементів із класу в клас, яке веде до по-
           кращення функціоналу якості.
                Для наочності процес послідовного групування відобра-
           жають графічно на дендрограмі, де по вертикалі відкладаються
           відстані (міри подібності), а по горизонталі – номери об’єктів.
                Існує  багато  алгоритмів,  реалізуючих  кластер  –  аналіз.
           Для прикладу, розглянемо один із них, який ілюструє ієрархі-
           чну процедуру побудови класів.
                Нехай задана мішана вибірка  ,...,x 1  x n , де  x  p - вимі-
           рні нормовані вектори спостережень ( p  - число ознак). Проце-
           дура попереднього нормування спостережень дозволяє звести
           ознаки до одного масштабу.

                                            178
   174   175   176   177   178   179   180   181   182   183   184