Page 26 - 4196
P. 26

 i
              або  K ) або зовсім невідомі. В залежності від об’єму
           первинної  апріорної  інформації  класифікаційні  системи
           можна  розділити  на  системи  «без  вчителя»,  системи  «з
           вчителем» та «самонавчальні» системи. В п.4.3 були роз-
           глянуті класифікаційні правила без вчителя, коли об’єми
           апріорної  інформації про об’єкти класифікації максима-
           льні. В системах класифікації  «з вчителем» класи пред-
           ставлені  кінцевими  вибірками  (навчальні  вибірки).  Ці
           вибірки можна використати для оцінки невідомих пара-
           метрів розподілів або самих розподілів, а самі оцінки - в
           класифікаційних  критеріях.  В  даному  параграфі  розгля-
           нута група таких критеріїв.

                 4.4.1 Апроксимація розподілів
                 Основним методом знаходження рішаючої функції,
           якщо класи представлені вибірками, є попередня апрок-
           симація розподілів  xP   i  .
                 Існує  два  підходи  до  задачі  статистичної  апрокси-
           мації розподілів. В першому апріорно відомий аналітич-
           ний  вид  функції  розподілу,  але  невідомі  її  параметри.
           Тоді  задача  апроксимації  полягає  в  оцінці  параметрів
           (параметрична оцінка розподілів).
                 Якщо  вид  розподілу  невідомий,  то  апроксимацію
           невідомої функції розподілу за вибіркою  x    1 ,..., x  нази-
                                                               n
           вають  непараметричною.  Непараметрична оцінка  функ-
           ції може бути зведена до параметричної, якщо її можна
           описати кінцевою кількістю параметрів, наприклад, роз-
           клавши  функцію  по  деякому  базису  та  обмеживши  цей
           розклад кінцевою кількістю складових.
                 Параметричну  оцінку  розподілу  можна  виконати
           методом максимуму вірогідності або методом Байеса.

                 1 Метод максимуму вірогідності
                 Це найбільш поширений метод знаходження оцінок
           параметрів  розподілів.  Розглянемо  систему  n   незалеж-
           них    однаково     розподілених    випадкових     величин
            X 1 ,..., X ,  кожна  -  розмірністю  m,  заданих  реалізацією
                    n
           спостережень  x  1 ,...,  x . Сумісний розподіл спостережень,
                                 n
                                        26
   21   22   23   24   25   26   27   28   29   30   31