Page 68 - 4196
P. 68
Рисунок 4.2 - Дендрограма до прикладу 4.4
Отримані результати дозволяють виділити у міша-
ній вибірці окремі однорідні групи (класи):
а) при
d kp 4 ,x 1 x 4 , x 5 x, 2 , x 3 x, 6 , x 8 x, 7 ;
б) для двох класів -
,x 1 x 2 , x 3 , x 4 , x 5 ,x, 6 x 7 , x 8 .
За принципом контрастності груп більш об’єктивною
виглядає класифікація a ).
Класифікації кластер-аналізом можуть підлягати як
об’єкти ( Q - аналіз), так і ознаки ( R - аналіз). В R -
аналізі мірою подібності двох ознак може відігравати
2
величина d 1 r , де r - коефіцієнт кореляції.
ij
ij
ij
4.7 Перетворення даних та виділення
інформативних ознак
Попередня обробка інформації, яку належить кла-
сифікувати, як правило, включає рішення двох задач:
перетворення з метою підсилення контрастності класів
простору та задачі визначення найбільш інформативних
ознак. Вибір найбільш ефективних ознак дозволяє знизи-
ти розмірність вектора спостережень. Оптимальний вибір
ознак може здійснюватися або поза зв’язку із якістю кла-
сифікації або безпосередньо може бути пов’язаний із які-
стю класифікації. У другому випадку ефективність обра-
них ознак виявляється у термінах ймовірності правильної
класифікації.
4.7.1 Відстані
При порівнянні об’єктів класифікації не усі ознаки,
яким відповідають окремі координатні вісі , однаково
важливі для визначення класу. Мірою значущості ознаки
може бути його вага. Надання ваг ознакам можна здійс-
68