Page 24 - 4703
P. 24
вагу простішій моделі, з двох мереж з приблизно рівними по-
милками контролю має сенс вибрати ту, яка менше.
Необхідність багатократних експериментів веде до того,
що контрольна множина починає грати ключову роль у виборі
моделі, тобто стає частиною процесу навчання. Тим самим
послаблюється її роль як незалежного критерію якості моделі -
при великому числі експериментів є ризик вибрати "вдалу"
мережу, що дає добрий результат на контрольній множині.
Для того, щоб надати остаточній моделі належну надійність,
часто (принаймні, коли об'єм нвчальних даних це дозволяє)
поступають так: резервують ще одну - тестову множину спо-
стережень. Підсумкова модель тестується на даних з цієї мно-
жини, щоб переконатися, що результати, досягнуті на нав-
чальному і контрольному множинах реальні, а не є артефакта-
ми процесу навчання. Зрозуміло, для того, щоб добре грати
свою роль, тестова множина має бути використана тільки один
раз: якщо її використати повторно для коригування процесу
навчання, то вона фактично перетвориться на контрольну
множину.
Отже, побудова мережі (після вибору вхідних змінних)
складається з наступних кроків:
Вибрати початкову конфігурацію мережі (наприклад,
один проміжний шар з числом елементів в нім, рівним напів-
сумі числа входів і числа виходів - Network Advisor (настав-
ник) пакету ST Neural Networks запропонує Вам таку конфі-
гурацію за умовчанням).
Провести ряд експериментів з різними конфігураціями,
запам'ятовуючи при цьому кращу мережу (у сенсі контрольної
помилки). У пакеті ST Neural Networks передбачено автомати-
чне запам'ятовування кращої мережі під час експерименту.
Для кожної конфігурації слід провести декілька експеримен-
тів, щоб не отримати помилковий результат через те, що про-
цес навчання потрапив в локальний мінімум.
Якщо в черговому експерименті спостерігається недо-
навчання (мережа не видає результат прийнятної якості),
спробувати додати додаткові нейрони в проміжний шар (ша-
ри). Якщо це не допомагає, спробувати додати новий проміж-
ний шар.
24