Page 24 - 4703
P. 24

вагу простішій моделі, з двох мереж з приблизно рівними по-
           милками контролю має сенс вибрати ту, яка менше.
                Необхідність багатократних експериментів веде до того,
           що контрольна множина починає грати ключову роль у виборі
           моделі,  тобто  стає  частиною  процесу  навчання.  Тим  самим
           послаблюється її роль як незалежного критерію якості моделі -
           при  великому  числі  експериментів  є  ризик  вибрати  "вдалу"
           мережу,  що  дає  добрий  результат  на  контрольній  множині.
           Для того, щоб надати остаточній моделі  належну надійність,
           часто  (принаймні,  коли  об'єм  нвчальних  даних  це  дозволяє)
           поступають так: резервують ще одну - тестову множину спо-
           стережень. Підсумкова модель тестується на даних з цієї мно-
           жини,  щоб  переконатися,  що  результати,  досягнуті  на  нав-
           чальному і контрольному множинах реальні, а не є артефакта-
           ми  процесу  навчання.  Зрозуміло,  для  того,  щоб  добре  грати
           свою роль, тестова множина має бути використана тільки один
           раз:  якщо  її  використати  повторно  для  коригування  процесу
           навчання,  то  вона  фактично  перетвориться  на  контрольну
           множину.
                Отже,  побудова  мережі  (після  вибору  вхідних  змінних)
           складається з наступних кроків:
                 Вибрати  початкову  конфігурацію  мережі  (наприклад,
           один проміжний шар з числом елементів в нім, рівним напів-
           сумі числа входів і числа виходів  - Network Advisor (настав-
           ник)  пакету ST Neural Networks запропонує Вам таку конфі-
           гурацію за умовчанням).
                 Провести ряд експериментів з різними конфігураціями,
           запам'ятовуючи при цьому кращу мережу (у сенсі контрольної
           помилки). У пакеті ST Neural Networks передбачено автомати-
           чне  запам'ятовування  кращої  мережі  під  час  експерименту.
           Для  кожної  конфігурації  слід  провести  декілька  експеримен-
           тів, щоб не отримати помилковий результат через те, що про-
           цес навчання потрапив в локальний мінімум.
                 Якщо в черговому  експерименті  спостерігається недо-
           навчання  (мережа  не  видає  результат  прийнятної  якості),
           спробувати додати додаткові нейрони в проміжний шар (ша-
           ри). Якщо це не допомагає, спробувати додати новий проміж-
           ний шар.




                                          24
   19   20   21   22   23   24   25   26   27   28   29