Page 27 - 4713
P. 27

–  розділення  вихідних  даних  досліджуваної  сукупності  на
            задану кількість кластерів;

                   –  обчислення  багатовимірних  середніх  (центрів  тяжіння)
            виділених кластерів;
                   – розрахунку Евклідової відстані кожної одиниці сукупності до

            визначених центрів тяжіння кластерів та побудова матриці відстаней,
            яка ґрунтується на метриці відстаней. Використовують різні метрики
            відстаней,  наприклад:  Евклідова  відстань  (проста  і  зважена),

            Манхеттенська, Чебишева, Мінковського, Махалонобіса тощо;
                   – визначення нових центів тяжіння та нових кластерів.
                   Найбільш  відомими  та  широко  застосовуваними  методами
            формування кластерів є:

                   – одиничного зв'язку;
                   – повного зв'язку;
                   – середнього зв'язку;

                   – метод Уорда.
                   Метод одиничного зв'язку (метод близького сусіда) передбачає
            приєднання  одиниці  сукупності  до  кластера,  якщо  вона  близька
            (знаходиться  на  одному  рівні  схожості)  хоча  б  до  одного

            представника цього кластера.
                   Метод повного зв'язку (далекого сусіда) вимагає певного рівня
            подібності  об'єкта  (не  менше  граничного  рівня),  що  передбачається

            включити у кластер, з будь-яким іншим.
                   Метод середнього зв'язку ґрунтується на використанні середньої
            відстані  між  кандидатом  на  включення  у  кластер  і  представниками

            наявного кластера.
                   Згідно  методу  Уорда  приєднання  об'єктів  до  кластерів
            здійснюється  у  випадку  мінімального  приросту  внутрішньогрупової

            суми  квадратів  відхилень.  Завдяки  цьому  утворюються  кластери
            приблизно одного розміру, які мають форму гіперсфер.
                   Оптимальною  прийнято  вважати  кількість  кластерів,  яка
            визначається  як  різниця  кількості  спостережень  і  кількості  кроків,

            після якої відстань об'єднання збільшується стрибкоподібно.
                   Факторний             аналіз        може        бути        одноступінчатим              і
            багатоступінчастим. Перший тип використовується для дослідження

            факторів  тільки  одного  рівня  підпорядкування  без  їх  деталізації  на
            складові  частини.  Наприклад,  у  =  а  Ф  b.  При  багатоступінчастому
            факторному аналізі проводиться деталізація факторів а і b на складові
            частини  з  ціллю  вивчення  їх  поведінки.  Деталізація  факторів  може

                                                           27
   22   23   24   25   26   27   28   29   30   31   32