Page 25 - 4713
P. 25
ЛЕКЦІЯ 4
Кластерний аналіз. Методи кластеризації. Факторний
аналіз. Факторний аналіз як метод редукції даних. Аналіз
головних компонент і класифікація. Дисперсійний аналіз.
Однофакторний. Багатофакторний.
Кластерний аналіз – це метод багатомірного статистичного
дослідження, до якого належать збір даних, що містять інформацію
про вибіркові об'єкти, та упорядкування їх в порівняно однорідні,
схожі між собою групи.
Отже, сутність кластерного аналізу полягає у здійсненні
класифікації об'єктів дослідження за допомогою численних
обчислювальних процедур. В результаті цього утворюються
"кластери" або групи дуже схожих об'єктів. На відміну від інших
методів, цей вид аналізу дає можливість класифікувати об'єкти не за
однією ознакою, а за декількома одночасно. Для цього вводяться
відповідні показники, що характеризують певну міру близькості за
всіма класифікаційними параметрами.
Мета кластерного аналізу полягає в пошуку наявних структур,
що виражається в утворенні груп схожих між собою об'єктів –
кластерів. Водночас його дія полягає й у привнесенні структури в
досліджувані об'єкти. Це означає, що методи кластеризації необхідні
для виявлення структури в даних, яку нелегко знайти при
візуальному обстеженні або за допомогою експертів.
Основними завданнями кластерного аналізу є:
– розробка типології або класифікації досліджуваних об'єктів;
– дослідження та визначення прийнятних концептуальних схем
групування об'єктів;
– висунення гіпотез на підставі результатів дослідження даних;
– перевірка гіпотез чи справді типи (групи), які були виділені
певним чином, мають місце в наявних даних.
Кластерний аналіз потребує здійснення таких послідовних
кроків:
1) проведення вибірки об'єктів для кластеризації;
2) визначення множини ознак, за якими будуть оцінюватися
відібрані об'єкти;
3) оцінка міри подібності об'єктів;
4) застосування кластерного аналізу для створення груп
подібних об'єктів;
25