Page 54 - 4268
P. 54

зв'язує  вхідні  змінні  з  виходами.  Ми  оцінюємо  цю  функцію  за
            допомогою  підгонки  функції  до  доступними  даними.  Проблема
            при підгонці кривої до точок даними полягає в тому, що якщо ми
            виберемо досить незвичну функцію, то в подальшому ми будемо

                                                                        повторювати  деякий
                                                                        "шум",  а  не  вихідну
                                                                        невідому          функцію.

                                                                        Нижче           наводиться
            фігура, яка ілюструє цю задачу за підгонки регресійної прямої в
            одному вимірі - більш гладка лінія буде найкращою, навіть якщо
            вона         не        проходить            через        всі        точки         даних.

            Можливість  обробки  нових  даних  називається  "узагальненням".
            Ця властивість є найбільш важливою характеристикою нейронної
            мережі.  Як  ми  можемо  гарантувати  гарну  якість  узагальнення?

            Важливий метод полягає в тому, що ми залишаємо частину даних
            і  не  використовуємо  їх  при  навчанні  нейронної  мережі.  Ці  дані
            можна  використовувати  при  перевірці  отриманої  мережі.

            Виділені дані використовуються двома способами. По-перше, під
            час навчання кривизна функції збільшується, і тому ми можемо
            зупинити  процес,  якщо  якість  нейронної  мережі  починає

            "погіршуватися".  Таким чином,  ми  уникаємо  перенавчання.  По-
            друге,  якщо  ми  побудували  кілька  нейронних  мереж  і  хочемо
            вибрати найкращу, ми не можемо порівняти їх продуктивність на
            навчальних множинах, оскільки одна мережа може перенавчили.

            Однак,  ми  можемо  вибрати  нейронну  мережу  з  найкращою
            продуктивністю на контрольній вибірці.
                  Проте,  при  такому  використанні  підвибірки  може  з'явитися

            інша  проблема.  При  перевірці  великої  кількості  мереж,  якщо
            вибрана  мережа  з  найкращою  продуктивністю,  ми  ефективно
            проводимо вибірковий експеримент, і ми можемо зупинитися на
            нейронній  мережі  з  оманливо  хорошим  рівнем  продуктивності,

            що  насправді  не  відображає  можливість  узагальнення.  Тому  ми
            можемо  виділити  ще  одну  підвибірки  даних  (тестову  вибірку),
            яка буде використовуватися на заключній стадії процесу пошуку

            для  перевірки  дійсної  помилки.  Якщо  контрольна  і  тестова
            помилки  розрізняються  не  дуже  сильно,  то  можна  зробити
            висновок про те, що нейронна мережа навчена добре.





                                                         54
   49   50   51   52   53   54   55   56   57   58   59