Page 29 - 4703
P. 29
лінію - або, у разі більш високої розмірності, - гіперплощину,
що розділяє точки в просторі ознак).
Мережа, що містить один проміжний шар, будує декіль-
ка сигмоідних схилів - по одному для кожного прихованого
елементу - і потім вихідний елемент комбінує з них "височи-
ну". Ця височина виходить опуклою, тобто що не містить за-
падин. При цьому в деяких напрямах вона може йти на
нескінченність (як довгий півострів). Така мережа може моде-
лювати більшість реальних завдань класифікації.
На цьому рисунку показана
поверхня відгуку, отримана
багатошаровим персептроном
для вирішення завдання
"виключаюче або": добре
видно, що вона виділяє об-
ласть простору, розташовану
уздовж діагоналі.
Мережа з двома про-
між-ними шарами будує
комбінацію з декількох таких
височин. Їх буде стільки ж,
скільки елементів в другому
шарі, і у кожної з них буде
стільки сторін, скільки елементів було в першому приховано-
му шарі. Після невеликого роздуму можна дійти висновку, що,
використовуючи достатнє число таких височин, можна відтво-
рити поверхню будь-якої форми - у тому числі із западинами і
вогнутостями.
Як наслідок наших розглядів ми отримуємо, що, теоре-
тично, для моделювання будь-якого завдання досить бага-
тошарового персептрона з двома проміжними шарами (у точ-
ному формулюванні цей результат відомий як теорема Колмо-
горова). При цьому може виявитися і так, що для вирішення
деякого конкретного завдання простішою і зручнішою буде
мережа з ще більшим числом шарів. Проте, для вирішення
більшості практичних завдань досить усього одного
проміжного шару, два шари застосовуються як резерв в особ-
ливих випадках, а мережі з трьома шарами практично не за-
стосовуються.
29