Page 27 - 4713
P. 27
– розділення вихідних даних досліджуваної сукупності на
задану кількість кластерів;
– обчислення багатовимірних середніх (центрів тяжіння)
виділених кластерів;
– розрахунку Евклідової відстані кожної одиниці сукупності до
визначених центрів тяжіння кластерів та побудова матриці відстаней,
яка ґрунтується на метриці відстаней. Використовують різні метрики
відстаней, наприклад: Евклідова відстань (проста і зважена),
Манхеттенська, Чебишева, Мінковського, Махалонобіса тощо;
– визначення нових центів тяжіння та нових кластерів.
Найбільш відомими та широко застосовуваними методами
формування кластерів є:
– одиничного зв'язку;
– повного зв'язку;
– середнього зв'язку;
– метод Уорда.
Метод одиничного зв'язку (метод близького сусіда) передбачає
приєднання одиниці сукупності до кластера, якщо вона близька
(знаходиться на одному рівні схожості) хоча б до одного
представника цього кластера.
Метод повного зв'язку (далекого сусіда) вимагає певного рівня
подібності об'єкта (не менше граничного рівня), що передбачається
включити у кластер, з будь-яким іншим.
Метод середнього зв'язку ґрунтується на використанні середньої
відстані між кандидатом на включення у кластер і представниками
наявного кластера.
Згідно методу Уорда приєднання об'єктів до кластерів
здійснюється у випадку мінімального приросту внутрішньогрупової
суми квадратів відхилень. Завдяки цьому утворюються кластери
приблизно одного розміру, які мають форму гіперсфер.
Оптимальною прийнято вважати кількість кластерів, яка
визначається як різниця кількості спостережень і кількості кроків,
після якої відстань об'єднання збільшується стрибкоподібно.
Факторний аналіз може бути одноступінчатим і
багатоступінчастим. Перший тип використовується для дослідження
факторів тільки одного рівня підпорядкування без їх деталізації на
складові частини. Наприклад, у = а Ф b. При багатоступінчастому
факторному аналізі проводиться деталізація факторів а і b на складові
частини з ціллю вивчення їх поведінки. Деталізація факторів може
27