Page 26 - 4196
P. 26
i
або K ) або зовсім невідомі. В залежності від об’єму
первинної апріорної інформації класифікаційні системи
можна розділити на системи «без вчителя», системи «з
вчителем» та «самонавчальні» системи. В п.4.3 були роз-
глянуті класифікаційні правила без вчителя, коли об’єми
апріорної інформації про об’єкти класифікації максима-
льні. В системах класифікації «з вчителем» класи пред-
ставлені кінцевими вибірками (навчальні вибірки). Ці
вибірки можна використати для оцінки невідомих пара-
метрів розподілів або самих розподілів, а самі оцінки - в
класифікаційних критеріях. В даному параграфі розгля-
нута група таких критеріїв.
4.4.1 Апроксимація розподілів
Основним методом знаходження рішаючої функції,
якщо класи представлені вибірками, є попередня апрок-
симація розподілів xP i .
Існує два підходи до задачі статистичної апрокси-
мації розподілів. В першому апріорно відомий аналітич-
ний вид функції розподілу, але невідомі її параметри.
Тоді задача апроксимації полягає в оцінці параметрів
(параметрична оцінка розподілів).
Якщо вид розподілу невідомий, то апроксимацію
невідомої функції розподілу за вибіркою x 1 ,..., x нази-
n
вають непараметричною. Непараметрична оцінка функ-
ції може бути зведена до параметричної, якщо її можна
описати кінцевою кількістю параметрів, наприклад, роз-
клавши функцію по деякому базису та обмеживши цей
розклад кінцевою кількістю складових.
Параметричну оцінку розподілу можна виконати
методом максимуму вірогідності або методом Байеса.
1 Метод максимуму вірогідності
Це найбільш поширений метод знаходження оцінок
параметрів розподілів. Розглянемо систему n незалеж-
них однаково розподілених випадкових величин
X 1 ,..., X , кожна - розмірністю m, заданих реалізацією
n
спостережень x 1 ,..., x . Сумісний розподіл спостережень,
n
26