Page 83 - 4196
P. 83

1 Оцінка інформативності через умовні щільності
           критерію.
                 Універсальним  критерієм  оцінки  якості  класифіка-
           ції  являється  надійність    розділу  об’єктів  двох  класів,
           яка оцінюється через ймовірності похибок першого    і
           другого    роду:
                                  1  p 1    p 2 ,

           де  p , p  - апріорні ймовірності об’єктів класів    і   ;
                1
                                                                     2
                                                               1
                    2
                P   2   1 ,     P   1   2  .
                 Похибка першого роду    полягає в тому, що при-
           ймається рішення про віднесення об’єкту до другого кла-
           су   , якщо насправді об’єкт належить першому класу
                 2
             . Похибка другого роду виникає тоді, коли приймаєть-
             1
           ся рішення про віднесення об’єкту  до першого класу, в
           той час, як в дійсності це об’єкт другого класу. Ймовір-
           ність похибок першого і другого роду оцінюють за відо-
           мими умовними розподілами ознак  xf     i   1  і  xf  i   2  .
                 Ознака  із  більшим  значенням    рахується  більш
           інформативною.
                 Цей  підхід  нескладно  розповсюдити  на  довільне
           число  класів.  Наприклад,  для  трьох  класів  надійність
           розділу класів дорівнює
               1  p  12    p  12   p   2  23    p  23  p   1  13    p  13 .
                             2
                     1
                                                                3
                                               3

                 2 Порівняння числових характеристик ознак.
           Зрівнювана  оцінка  інформативності  ознак  може  бути
           здійснена  у  випадку,  коли  умовні  щільності  розподілу
           ознак  xf  i   k   невідомі, однак відомі перші і другі мо-
           менти цих розподілів, тобто  m  і  D . Оцінка, яка базу-
                                            ki
                                                  ki
           ється  на  використанні  цих  характеристик  можлива  у
           зв’язку з тим, що ознаки  x  можна умовно розподілити
                                        i
           на дві групи.
                 До першої групи відносяться ознаки, значення яких
           чутливі  до  зміни  об’єктів  одного  класу  і  нечутливі  при
           переходах до об’єктів інших класів.
                                        83
   78   79   80   81   82   83   84   85   86   87   88