Page 26 - 4703
P. 26

Мережа навчається тому, чому найпростіше навчити-
           ся.  Класичним  (можливо,  вигаданим)  прикладом  є  система
           машинного зору, призначена для автоматичного розпізнавання
           танків. Мережа навчалася на ста картинках, що містять зобра-
           ження танків, і на ста інших картинках, де танків не було. Був
           досягнутий  стовідсотково  "правильний"  результат.  Але  коли
           на вхід мережі були подані нові дані, вона безнадійно прова-
           лилася. У чому ж була причина? З'ясувалося, що фотографії з
           танками були зроблені в похмурий, дощовитий день, а фото-
           графії без танків - в сонячний день. Мережа навчилася улов-
           лювати (очевидну) різницю в загальній освітленості. Щоб ме-
           режа могла результативно працювати, її слід було навчати на
           даних,  де  б  були  присутніми  усі  погодні  умови  і  типи
           освітлення,  при  яких  мережу  передбачається  використати  -  і
           це ще не говорячи про рельєф місцевості, дистанцію зйомки і
           так далі.
                Незбалансований набір даних. Якщо мережа мінімізує за-
           гальну  погрішність,  важливе  значення  набуває  пропорції,  в
           яких представлені дані різних типів. Мережа, навчена на 900
           хороших і 100 поганих прикладах спотворюватиме результат
           на користь хороших спостережень, оскільки це дозволить ал-
           горитму  зменшити  загальну  погрішність  (яка  визначається  в
           основному  хорошими  випадками).  Якщо  в  реальній  ситуації
           хороші і погані об'єкти представлені в іншій пропорції, то ре-
           зультати, що видаються мережею, можуть виявитися невірни-
           ми. Хорошим прикладом служить завдання виявлення захво-
           рювань. Нехай, наприклад,  при звичайних обстеженнях в се-
           редньому  90%  людей  виявляються  здоровими.  Мережа  нав-
           чається на наявних даних, в яких пропорція здорові/хворі рів-
           на 90/10. Потім вона застосовується для діагностики пацієнтів
           з  визначеним  скаргами,  серед  яких  це  співвідношення  вже
           50/50.  В  цьому  випадку  мережа  ставитиме  діагноз  занадто
           обережно і не розпізнає захворювання у деяких хворих. Якщо
           ж,  навпаки,  мережу  навчити  на  даних  "із  скаргами",  а  потім
           протестувати  на  "звичайних"  даних,  то  вона  видаватиме
           підвищене число неправильних діагнозів про наявність захво-
           рювання. У таких ситуаціях навчальні дані треба скорегувати
           так, щоб були враховані відмінності в розподілі даних (напри-
           клад, можна повторювати рідкісні спостереження або видали-
           ти ті, що часто зустрічаються), або ж видозмінити рішення, що

                                          26
   21   22   23   24   25   26   27   28   29   30   31