Page 176 - 4511
P. 176
9 КЛАСТЕРНИЙ АНАЛІЗ
9.1 Загальні відомості
В складно побудованих районах, коли мінливість харак-
теристик об’єктів досить значна, доцільність використання кла-
сифікація геологічних об’єктів з використанням навчання на
еталонах має свої обмеження, які передбачають, що нові
об’єкти мають природу, ідентичну з еталонами. В такому ви-
падку кращі результати можна отримати, застосувавши класи-
фікацію без навчання (самонавчання), яка базується на виді-
ленні класів за принципом однорідності об’єктів та подібності
ознак. Геологічна природа класів може бути установлена пода-
льшими дослідженнями, наприклад, бурінням.
Існує декілька підходів, які дозволяють з мішаної вибірки
виділяти та описувати класи. Набір методів виділення класів,
що використовують «внутрішні» властивості мішаної вибірки,
таких, як міра подібності між окремими елементами або гру-
пами елементів, відноситься до кластер-аналізу.
Інший підхід використовує «зовнішні» властивості міша-
ної вибірки, які характеризують її в цілому, такі, наприклад, як
число мод вибіркової щільності, властивості коваріаційної ма-
триці, інших вибіркових моментів, рангові властивості. До ме-
тодів виділення класів, які використовують «зовнішні» власти-
вості мішаної вибірки, можна віднести факторний, компонент-
ний аналізи, метод сумішей.
Обидва підходи виділення класів (генерації гіпотез) мо-
жуть застосовуватись сумісно.
Більшість методів генерації гіпотез не відносяться до
строго поставлених статистичних задач, оскільки вони в знач-
ній мірі залежать від того, як визначені поняття однорідності
об’єктів та міра подібності.
Кластер – аналіз можна розглядати, як допоміжний метод,
що дозволяє виконувати на попередньому етапі розділення мі-
шаної (неоднорідної) вибірки на класи. Припускається, що в за-
даній мішаній вибірці існують стійкі комбінації ознак (класи),
а кількість їх кінцева. При цьому число класів може бути відо-
мим або невідомим. Припущення про те, що вибірка
175