Page 26 - 4703
P. 26
Мережа навчається тому, чому найпростіше навчити-
ся. Класичним (можливо, вигаданим) прикладом є система
машинного зору, призначена для автоматичного розпізнавання
танків. Мережа навчалася на ста картинках, що містять зобра-
ження танків, і на ста інших картинках, де танків не було. Був
досягнутий стовідсотково "правильний" результат. Але коли
на вхід мережі були подані нові дані, вона безнадійно прова-
лилася. У чому ж була причина? З'ясувалося, що фотографії з
танками були зроблені в похмурий, дощовитий день, а фото-
графії без танків - в сонячний день. Мережа навчилася улов-
лювати (очевидну) різницю в загальній освітленості. Щоб ме-
режа могла результативно працювати, її слід було навчати на
даних, де б були присутніми усі погодні умови і типи
освітлення, при яких мережу передбачається використати - і
це ще не говорячи про рельєф місцевості, дистанцію зйомки і
так далі.
Незбалансований набір даних. Якщо мережа мінімізує за-
гальну погрішність, важливе значення набуває пропорції, в
яких представлені дані різних типів. Мережа, навчена на 900
хороших і 100 поганих прикладах спотворюватиме результат
на користь хороших спостережень, оскільки це дозволить ал-
горитму зменшити загальну погрішність (яка визначається в
основному хорошими випадками). Якщо в реальній ситуації
хороші і погані об'єкти представлені в іншій пропорції, то ре-
зультати, що видаються мережею, можуть виявитися невірни-
ми. Хорошим прикладом служить завдання виявлення захво-
рювань. Нехай, наприклад, при звичайних обстеженнях в се-
редньому 90% людей виявляються здоровими. Мережа нав-
чається на наявних даних, в яких пропорція здорові/хворі рів-
на 90/10. Потім вона застосовується для діагностики пацієнтів
з визначеним скаргами, серед яких це співвідношення вже
50/50. В цьому випадку мережа ставитиме діагноз занадто
обережно і не розпізнає захворювання у деяких хворих. Якщо
ж, навпаки, мережу навчити на даних "із скаргами", а потім
протестувати на "звичайних" даних, то вона видаватиме
підвищене число неправильних діагнозів про наявність захво-
рювання. У таких ситуаціях навчальні дані треба скорегувати
так, щоб були враховані відмінності в розподілі даних (напри-
клад, можна повторювати рідкісні спостереження або видали-
ти ті, що часто зустрічаються), або ж видозмінити рішення, що
26