Page 56 - 4196
P. 56
Інший підхід використовує «зовнішні» властивості
мішаної вибірки, які характеризують її в цілому, такі,
наприклад, як число мод вибіркової щільності, властиво-
сті коваріаційної матриці, інших вибіркових моментів,
рангові властивості. До методів виділення класів, які ви-
користовують «зовнішні» властивості мішаної вибірки,
можна віднести факторний, компонентний аналізи, ме-
тод сумішей.
Обидва підходи виділення класів (генерації гіпотез)
можуть застосовуватись сумісно.
Більшість методів генерації гіпотез не відносяться
до строго поставлених статистичних задач, оскільки вони
в значній мірі залежать від того, як визначені поняття
однорідності об’єктів та міра подібності. Виключенням є
задача розділення суміші розподілів – метод сумішей.
При цьому приймається, що компоненти суміші – класи,
а коефіцієнти розкладу – апріорні частоти класів.
4.6.1 Методи кластер – аналізу
Кластер – аналіз можна розглядати, як допоміжний
метод, що дозволяє виконувати на попередньому етапі
розділення мішаної (неоднорідної) вибірки на класи.
Припускається, що в заданій мішаній вибірці існують
стійкі комбінації ознак (класи), а кількість їх кінцева.
При цьому число класів може бути відомим або невідо-
мим. Припущення про те, що вибірка ,x 1 x 2 ,..., x n мі-
шана, в процесі кластер – аналізу може не підтвердитися.
В кластер – аналізі розділення на класи базується на
мірі попарної подібності елементів вибірки, яка узагаль-
нюється в процесі розділення на класи до міри групової
подібності. Розглянемо декілька типових прикладів по-
будови міри попарної подібності.
1 «Зважена» евклідова відстань між елементами
x та x :
i
j
1 1 2 p p 2
d ,x i x j c 1 x i x j ... c p x i x j .
2 Зважена відстань
56