Page 212 - 4703
P. 212
льній множині. Проте, важливий не сам факт відмінності, а
спостережувана тенденція помилок.
Дійсно, алгоритм навчання націлений на мінімізацію по-
милки на виході мережі. Відповідно, помилка на навчальній
множині просто зобов'язана в середньому зменшуватися. Але
ніхто не обіцяє спаду помилки на контрольній множині. Отже,
якщо спостерігається картина зростання помилки на контро-
льній множині, тоді як вона зменшується на навчальній мно-
жині, то це говорить про те, що мережа "зазубрила" усі
пред’явлені спостереження і не здатна до узагальнення. Такий
стан називається перенавчанням. Бажано перенавчання уника-
ти. Алгоритм Automated network searcs (ANS) самостійно відс-
тежує перенавчання і при завершенні навчання повертає ме-
режу в найкращий стан (Retain Best Network - Відновити най-
кращу мережу).
Тестова множина не бере участь в навчанні взагалі. Вона
використовується після завершення навчання для розрахунку
продуктивності отриманої мережі і її помилки на даних, про
які "їй взагалі нічого невідомо". Хорошою мережею можна
вважати ту мережу, у якої помилка однаково мала на усіх
трьох підмножинах.
В результаті, кожна навчена і перевірена нейронна кон-
фігурація описується рядком в інформаційному полі діалого-
вого вікна. Найбільш важливими показниками тут є Profile -
Тип мережі, Training, Test, Select Performance - Продуктив-
ність мережі на навчальній, контрольній, тестовій множині.
У випадку процедури класифікації продуктивність є
процент спостережень, що правильно класифікуються. У ре-
зультаті, повина бути відібрана мережа, з найкращою продук-
тивністю, в сенсі максимального відсотка правильно класифі-
кованих спостережень.
Після завершення процесу створення мереж автоматично
відкривається вікно SAAN - Results (рис.7.8), де в електронній
таблиці відображені характеристики 5 найкращих утриманих
мереж
212