Page 93 - 4703
P. 93
Відповідно, для здійснення процедури порівняння ме-
реж, мережі необхідно навчати, розраховувати їх помилки і
продуктивності і потім ці показники порівнювати.
Для навчання алгоритм пошуку мережі розбиває (за умо-
вчанням) усю множину спостережень на Training - Навчальну,
Selection - Контрольну і Test - Тестову множини. Кожна з цих
множин несе свою важливу функцію.
На навчальній множині відбувається безпосереднє на-
вчання мережі, тобто зміна вагових коефіцієнтів кожного з
нейронів пропорційно помилці на виході. Відповідно усі спо-
стереження з цієї множини багаторазово беруть участь в про-
цедурі зміни вагових коефіцієнтів навчаної мережі.
Спостереження контрольної множини в процедурі зміни
вагів нейронів не беруть участь. Основна функція цих даних -
в постійному контролі здатності мережі до узагальнення да-
них, на яких вона не навчалася. Така процедура називається
крос - перевіркою. На кожному кроці алгоритму навчання роз-
раховується помилка для усього набору спостережень з конт-
рольної множини і порівнюється з помилкою на навчальній
множині.
Природно, що ці помилки відрізнятимуться. Як правило,
помилка на контрольній множині перевищує помилку на нав-
ча-
льній множині. Проте, важливий не сам факт відмінності, а
спостережувана тенденція помилок.
Дійсно, алгоритм навчання націлений на мінімізацію по-
милки на виході мережі. Відповідно, помилка на навчальній
множині просто зобов'язана в середньому зменшуватися. Але
ніхто не обіцяє спаду помилки на контрольній множині. Отже,
якщо спостерігається картина зростання помилки на контро-
льній множині, тоді як вона зменшується на навчальній мно-
жині, то це говорить про те, що мережа "зазубрила" усі
пред’явлені спостереження і не здатна до узагальнення. Такий
стан називається перенавчанням. Бажано перенавчання уника-
ти. Алгоритм Automated network searcs (ANS) самостійно відс-
тежує перенавчання і при завершенні навчання повертає ме-
режу в найкращий стан (Retain Best Network - Відновити най-
кращу мережу).
Тестова множина не бере участь в навчанні взагалі. Вона
використовується після завершення навчання для розрахунку
93