Page 93 - 4703
P. 93

Відповідно,  для  здійснення  процедури  порівняння  ме-
           реж,  мережі  необхідно  навчати,  розраховувати  їх  помилки  і
           продуктивності і  потім ці показники порівнювати.
                Для навчання алгоритм пошуку мережі розбиває (за умо-
           вчанням) усю множину спостережень на Training - Навчальну,
           Selection - Контрольну і Test - Тестову множини. Кожна з цих
           множин несе свою важливу функцію.
                На  навчальній  множині  відбувається  безпосереднє  на-
           вчання  мережі,  тобто  зміна  вагових  коефіцієнтів  кожного  з
           нейронів пропорційно помилці на виході. Відповідно усі спо-
           стереження з цієї множини багаторазово беруть участь в про-
           цедурі         зміни вагових коефіцієнтів навчаної мережі.
                Спостереження контрольної множини в процедурі зміни
           вагів нейронів не беруть участь. Основна функція цих даних -
           в  постійному  контролі  здатності  мережі  до  узагальнення  да-
           них,  на  яких  вона  не  навчалася.  Така  процедура  називається
           крос - перевіркою. На кожному кроці алгоритму навчання роз-
           раховується помилка для усього набору спостережень з конт-
           рольної  множини  і  порівнюється  з  помилкою  на  навчальній
           множині.
                Природно, що ці помилки відрізнятимуться. Як правило,
           помилка на контрольній множині перевищує помилку на нав-
           ча-
           льній  множині.  Проте,  важливий  не  сам  факт  відмінності,  а
           спостережувана тенденція помилок.
                Дійсно, алгоритм навчання націлений на мінімізацію по-
           милки  на  виході  мережі.  Відповідно,  помилка  на  навчальній
           множині просто зобов'язана в середньому зменшуватися. Але
           ніхто не обіцяє спаду помилки на контрольній множині. Отже,
           якщо  спостерігається  картина  зростання  помилки  на  контро-
           льній множині, тоді як вона зменшується на навчальній мно-
           жині,  то  це  говорить  про  те,  що  мережа  "зазубрила"  усі
           пред’явлені спостереження і не здатна до узагальнення. Такий
           стан називається перенавчанням. Бажано перенавчання уника-
           ти. Алгоритм Automated network searcs (ANS) самостійно відс-
           тежує  перенавчання  і  при  завершенні  навчання  повертає  ме-
           режу в найкращий стан (Retain Best Network - Відновити най-
           кращу мережу).
                Тестова множина не бере участь в навчанні взагалі. Вона
           використовується після завершення навчання для розрахунку

                                          93
   88   89   90   91   92   93   94   95   96   97   98