Page 144 - 4703

P. 144

Validation - Контрольну і Test - Тестову множини. Кожна з
цих множин несе свою важливу функцію.
На навчальній множині Training відбувається безпосере-
днє навчання мережі, тобто зміна вагових коефіцієнтів кожно-
го з нейронів пропорційно помилці на виході. Відповідно усі
спостереження з цієї множини багаторазово беруть участь в
процедурі зміни вагових коефіцієнтів навчаної мережі.
Спостереження контрольної множини Validation в про-
цедурі зміни вагів нейронів не беруть участь. Основна функція
цих даних - в постійному контролі здатності мережі до уза-
гальнення даних, на яких вона не навчалася. Така процедура
називається крос-перевіркою. На кожному кроці алгоритму
навчання розраховується помилка для усього набору спосте-
режень з контрольної множини і порівнюється з помилкою на
навчальній множині. Природно, що ці помилки відрізняти-
муться. Як правило, помилка на контрольній множині пере-
вищує помилку на навчальній множині. Проте, важливий не
сам факт відмінності, а спостережувана тенденція помилок.
Дійсно, алгоритм навчання націлений на мінімізацію по-
милки на виході мережі. Відповідно, помилка на навчальній
множині просто зобов'язана в середньому зменшуватися. Але
ніхто не обіцяє спаду помилки на перевірочній множині. От-
же, якщо спостерігається картина росту помилки на контроль-
ній множині, тоді як вона зменшується на навчальній множи-
ні, то це говорить про те, що мережа "зазубила" усі пред'явлені
їй спостереження і не здатна до узагальнення. Такий стан на-
зивається перенавчанням. Бажано перенавчання уникати. Ал-
горитм Automated network searcs (ANS) самостійно відстежує
перенавчання і при завершенні навчання повертає мережу в
найкращий стан (Retain Best Network - Відновити найкращу
мережу).
Тестова множина Test не бере участь в навчанні взагалі.
Воно використовується після завершення навчання для розра-
хунку продуктивності отриманої мережі і її помилки на даних,
про які "їй взагалі нічого невідомо". Хорошою мережею мож-
на вважати ту мережу, у якої помилка однаково мала на усіх
трьох підмножинах.
Для того, щоб вибрати потрібну мережу зі спискув акти-
вній робочій зоні, необхідно скористатися кнопкою Select
Models - Вибрати моделі діалогового вікна Results - Результа-

144

139 140 141 142 143 144 145 146 147 148 149