Page 13 - 4703
P. 13

ST  Neural  Networks  ви  можете  довільно  вибирати  змінні  і
           відміняти  попередній  вибір;  крім  того,  система  ST  Neural
           Networks  уміє  сама  дослідним  шляхом  відбирати  корисні
           змінні.  Спершу  має  сенс  включити  усі  змінні,  які,  на  вашу
           думку, можуть впливати на результат  - на подальших етапах
           можна скоротити число змінних.
                Нейронні мережі можуть працювати з числовими дани-
           ми, що лежать в певному обмеженому діапазону. Це створює
           проблеми  у  випадках,  коли  дані  мають  нестандартний  мас-
           штаб, або коли в них є пропущені значення, і коли дані є нечи-
           словими. У пакеті ST Neural Networks є засоби, що дозволяють
           впоратися з усіма цими труднощами. Числові дані масштабу-
           ються у відповідний для мережі діапазон, а пропущені значен-
           ня можна замінити на середнє значення (чи на іншу статисти-
           ку) цієї змінної по усіх наявних навчальних прикладах (Bishop,
           1995).
                Важчим  завданням  є  робота  з  даними  нечислового  ха-
           рактеру.  Найчастіше  нечислові  дані  бувають  представлені  у
           вигляді номінальних змінних типу Стать  ={Чоловік, Жінка}.
           Змінні з номінальними значеннями можна представити в чис-
           ловому виді, і в системі ST Neural Networks є засоби для робо-
           ти з такими даними. Проте, нейронні мережі не дають добрих
           результатів при роботі з номінальними змінними, які можуть
           набувати багато різних значень.
                Нечислові  дані  інших  типів  можна  або  перетворити  в
           числову  форму  або  оголосити  незначущими.  Значення  дат  і
           часу,  якщо  вони  потрібні,  можна  перетворити  в  числові,
           віднімаючи з них початкову дату (час). З довільними тексто-
           вими  полями  (наприклад,  прізвищами  людей)  працювати  не
           можна і їх треба зробити незначущими.
                Питання  про  те,  скільки  спостережень  треба  мати  для
           навчання  мережі,  часто  виявляється  непростим.  Відомий  ряд
           евристичних правил, що пов'язують число необхідних спосте-
           режень з розмірами мережі (просте з них свідчить, що число
           спостережень має бути вдесятеро більше числа зв'язків в ме-
           режі).  Насправді  це  число  залежить  також  від  (заздалегідь
           невідомої) складності того відображення, яке нейронна мере-
           жа  прагне  відтворити.  З  ростом  кількості  змінних  кількість
           необхідних спостережень росте нелінійно, так що вже при до-
           сить  невеликому  (наприклад,  п'ятдесят)  числі  змінних  може

                                          13
   8   9   10   11   12   13   14   15   16   17   18