Page 179 - 4511
P. 179
падках фіксується декілька значень d . Тоді кожному з них ві-
kp
дповідає певна класифікація. Іноді величина d вибирається
kp
таким чином, щоби виділити задану кількість класів.
Оптимізація процесу виділення класів можлива шляхом
введення в алгоритм міри якості (функціонала якості) класифі-
кації, яка може ґрунтуватися на мірах між групової подібності.
«Кращим» рахується групування, якому відповідає екстрема-
льне значення функціоналу якості.
Умовно можна виділити наступні типи процедур побу-
дови класів. Найпоширенішим є ієрархічний процес, який реа-
лізує послідовне об’єднання (роз’єднання) елементів у групи.
Кожному кроку відповідає деяке групування ,...X 1 X r . Якщо
на кожному кроці r збільшується, то процес називається агло-
меративним, якщо r зменшується, то процес називається диві-
зимним. Якщо число класів m попередньо відоме, то процес за-
вершується при досягненні числа m. При цьому, якщо одному і
тому ж m відповідає декілька класифікацій, вибирають класи-
фікацію за екстремальним значенням функціоналу якості. При
невідомому числу класів процес об’єднання завершується при
досягненні критичного значення d .
kp
При наявності еталонних даних E 0 E 1 0 ,..., E 0 , про
m
належність деяких елементів до певних класів та відомим чис-
лом класів m, використовується процедура приєднання елеме-
нтів до еталонів за принципом «найближчого» еталона.
Послідовне покращення класифікації можливе таким пе-
реміщенням окремих елементів із класу в клас, яке веде до по-
кращення функціоналу якості.
Для наочності процес послідовного групування відобра-
жають графічно на дендрограмі, де по вертикалі відкладаються
відстані (міри подібності), а по горизонталі – номери об’єктів.
Існує багато алгоритмів, реалізуючих кластер – аналіз.
Для прикладу, розглянемо один із них, який ілюструє ієрархі-
чну процедуру побудови класів.
Нехай задана мішана вибірка ,...,x 1 x n , де x p - вимі-
рні нормовані вектори спостережень ( p - число ознак). Проце-
дура попереднього нормування спостережень дозволяє звести
ознаки до одного масштабу.
178