Page 144 - 4703
P. 144

Validation  -  Контрольну  і  Test  -  Тестову  множини.  Кожна  з
           цих множин несе свою важливу функцію.
                На навчальній множині Training відбувається безпосере-
           днє навчання мережі, тобто зміна вагових коефіцієнтів кожно-
           го з нейронів пропорційно помилці на виході. Відповідно усі
           спостереження  з  цієї  множини  багаторазово  беруть  участь  в
           процедурі зміни вагових коефіцієнтів навчаної мережі.
                Спостереження  контрольної  множини  Validation  в  про-
           цедурі зміни вагів нейронів не беруть участь. Основна функція
           цих  даних  -  в  постійному  контролі  здатності  мережі  до  уза-
           гальнення даних, на яких вона не навчалася. Така процедура
           називається  крос-перевіркою.  На  кожному  кроці  алгоритму
           навчання  розраховується  помилка  для  усього  набору  спосте-
           режень з контрольної множини і порівнюється з помилкою на
           навчальній  множині.  Природно,  що  ці  помилки  відрізняти-
           муться.  Як  правило,  помилка  на  контрольній  множині  пере-
           вищує  помилку  на  навчальній  множині.  Проте,  важливий  не
           сам факт відмінності, а спостережувана тенденція помилок.
                Дійсно, алгоритм навчання націлений на мінімізацію по-
           милки  на  виході  мережі.  Відповідно,  помилка  на  навчальній
           множині просто зобов'язана в середньому зменшуватися. Але
           ніхто не обіцяє спаду помилки на перевірочній множині. От-
           же, якщо спостерігається картина росту помилки на контроль-
           ній множині, тоді як вона зменшується на навчальній множи-
           ні, то це говорить про те, що мережа "зазубила" усі пред'явлені
           їй спостереження і не здатна до узагальнення. Такий стан на-
           зивається перенавчанням. Бажано перенавчання уникати. Ал-
           горитм Automated network searcs (ANS) самостійно відстежує
           перенавчання  і  при  завершенні  навчання  повертає  мережу  в
           найкращий  стан  (Retain  Best  Network  -  Відновити  найкращу
           мережу).
                Тестова множина Test не бере участь в навчанні взагалі.
           Воно використовується після завершення навчання для розра-
           хунку продуктивності отриманої мережі і її помилки на даних,
           про які "їй взагалі нічого невідомо". Хорошою мережею мож-
           на вважати ту мережу, у якої помилка однаково мала на усіх
           трьох підмножинах.
                Для того, щоб вибрати потрібну мережу зі спискув акти-
           вній  робочій  зоні,  необхідно  скористатися  кнопкою  Select
           Models - Вибрати моделі діалогового вікна Results - Результа-

                                         144
   139   140   141   142   143   144   145   146   147   148   149