Page 19 - 4703
P. 19
Після того, як визначено число шарів і число елементів в
кожному з них, треба знайти значення для вагів і порогів ме-
режі, які б мінімізували помилку прогнозу, що видається ме-
режею. Саме для цього служать алгоритми навчання. З вико-
ристанням зібраних історичних даних ваги і порогові значення
автоматично коригуються з метою мінімізувати цю помилку.
По суті цей процес є підгонкою моделі, яка реалізується мере-
жею, до наявних повчальних даних. Помилка для конкретної
конфігурації мережі визначається шляхом прогону через ме-
режу усіх наявних спостережень і порівняння реально видава-
них вихідних значень з бажаними (цільовими) значеннями. Усі
такі різниці підсумовуються в так звану функцію помилок,
значення якої і є помилка мережі. В якості функції помилок
найчастіше береться сума квадратів помилок вихідних еле-
ментів для усіх спостережень. При роботі з пакетом ST Neural
Networks користувачеві видається так звана середньоквадра-
тична помилка (RMS) - описана вище величина нормується на
число спостережень і змінних, після чого з неї береться квад-
ратний корінь - це дуже хороша міра помилки, усереднена по
усій навчальній множині і по усіх вихідних елементах.
У традиційному моделюванні (наприклад, лінійному мо-
делюванні) можна алгоритмічно визначити конфігурацію мо-
делі, що дає абсолютний мінімум для вказаної помилки. Ціна,
яку доводиться платити за ширші (нелінійні) можливості мо-
делювання за допомогою нейронних мереж полягає в тому,
що, коригуючи мережу з метою мінімізувати помилку, ми
ніколи не можемо бути упевнені, що не можна добитися ще
меншої помилки.
У цих розглядах дуже корисним поняття є поверхня по-
милок. Кожній з ваг і порогів мережі (тобто вільних пара-
метрів моделі; їх загальне число позначимо через N)
відповідає один вимір у багатовимірному просторі. N+1-й
вимір відповідає помилці мережі. Для всіляких поєднань ваг
відповідну помилку мережі можна зображувати точкою в N+1-
мірному просторі і усі такі точки утворюють там деяку по-
верхню - поверхню помилок. Мета навчання нейронної мережі
полягає в тому, щоб знайти на цій багатовимірній поверхні
найнижчу точку.
У разі лінійної моделі з сумою квадратів в якості функції
помилок ця поверхня помилок буде параболоїдом (квадрикою)
19