Page 83 - 4196
P. 83
1 Оцінка інформативності через умовні щільності
критерію.
Універсальним критерієм оцінки якості класифіка-
ції являється надійність розділу об’єктів двох класів,
яка оцінюється через ймовірності похибок першого і
другого роду:
1 p 1 p 2 ,
де p , p - апріорні ймовірності об’єктів класів і ;
1
2
1
2
P 2 1 , P 1 2 .
Похибка першого роду полягає в тому, що при-
ймається рішення про віднесення об’єкту до другого кла-
су , якщо насправді об’єкт належить першому класу
2
. Похибка другого роду виникає тоді, коли приймаєть-
1
ся рішення про віднесення об’єкту до першого класу, в
той час, як в дійсності це об’єкт другого класу. Ймовір-
ність похибок першого і другого роду оцінюють за відо-
мими умовними розподілами ознак xf i 1 і xf i 2 .
Ознака із більшим значенням рахується більш
інформативною.
Цей підхід нескладно розповсюдити на довільне
число класів. Наприклад, для трьох класів надійність
розділу класів дорівнює
1 p 12 p 12 p 2 23 p 23 p 1 13 p 13 .
2
1
3
3
2 Порівняння числових характеристик ознак.
Зрівнювана оцінка інформативності ознак може бути
здійснена у випадку, коли умовні щільності розподілу
ознак xf i k невідомі, однак відомі перші і другі мо-
менти цих розподілів, тобто m і D . Оцінка, яка базу-
ki
ki
ється на використанні цих характеристик можлива у
зв’язку з тим, що ознаки x можна умовно розподілити
i
на дві групи.
До першої групи відносяться ознаки, значення яких
чутливі до зміни об’єктів одного класу і нечутливі при
переходах до об’єктів інших класів.
83