Page 19 - 4703
P. 19

Після того, як визначено число шарів і число елементів в
           кожному з них, треба знайти значення для вагів і порогів ме-
           режі, які б мінімізували помилку прогнозу, що видається ме-
           режею. Саме для цього служать алгоритми навчання. З вико-
           ристанням зібраних історичних даних ваги і порогові значення
           автоматично коригуються з метою мінімізувати цю помилку.
           По суті цей процес є підгонкою моделі, яка реалізується мере-
           жею, до наявних повчальних даних. Помилка для конкретної
           конфігурації  мережі  визначається  шляхом  прогону  через  ме-
           режу усіх наявних спостережень і порівняння реально видава-
           них вихідних значень з бажаними (цільовими) значеннями. Усі
           такі  різниці  підсумовуються  в  так  звану  функцію  помилок,
           значення  якої  і  є помилка  мережі.  В  якості  функції  помилок
           найчастіше  береться  сума  квадратів  помилок  вихідних  еле-
           ментів для усіх спостережень. При роботі з пакетом ST Neural
           Networks  користувачеві  видається  так  звана  середньоквадра-
           тична помилка (RMS) - описана вище величина нормується на
           число спостережень і змінних, після чого з неї береться квад-
           ратний корінь - це дуже хороша міра помилки, усереднена по
           усій навчальній множині і по усіх вихідних елементах.
                У традиційному моделюванні (наприклад, лінійному мо-
           делюванні) можна алгоритмічно визначити конфігурацію мо-
           делі, що дає абсолютний мінімум для вказаної помилки. Ціна,
           яку доводиться платити за ширші (нелінійні) можливості мо-
           делювання  за  допомогою  нейронних  мереж  полягає  в  тому,
           що,  коригуючи  мережу  з  метою  мінімізувати  помилку,  ми
           ніколи  не  можемо  бути  упевнені,  що  не  можна  добитися  ще
           меншої помилки.
                У цих розглядах дуже корисним поняття є поверхня по-
           милок.  Кожній  з  ваг  і  порогів  мережі  (тобто  вільних  пара-
           метрів  моделі;  їх  загальне  число  позначимо  через  N)
           відповідає  один  вимір  у  багатовимірному  просторі.  N+1-й
           вимір  відповідає  помилці  мережі.  Для  всіляких  поєднань  ваг
           відповідну помилку мережі можна зображувати точкою в N+1-
           мірному  просторі  і  усі  такі  точки  утворюють  там  деяку  по-
           верхню - поверхню помилок. Мета навчання нейронної мережі
           полягає  в  тому,  щоб  знайти  на  цій  багатовимірній  поверхні
           найнижчу точку.
                У разі лінійної моделі з сумою квадратів в якості функції
           помилок ця поверхня помилок буде параболоїдом (квадрикою)

                                          19
   14   15   16   17   18   19   20   21   22   23   24