Page 14 - 4703
P. 14

знадобитися  величезне  число  спостережень.  Ця  складність
           відома як "прокляття розмірності" і ми обговоримо її далі в
           цій главі.
                Для більшості реальних завдань буває досить декількох
           сотень  або  тисяч  спостережень.  Для  особливо  складних  зав-
           дань може знадобитися ще більша кількість, проте дуже рідко
           може зустрітися (навіть тривіальне) завдання, де вистачило б
           менше сотні спостережень. Якщо даних менше, ніж тут сказа-
           но,  то  насправді  у  вас  недостатньо  інформації  для  навчання
           мережі,  і  краще,  що  ви  можете  зробити  -  це  спробувати
           підігнати до даних деяку лінійну модель. У  пакеті ST Neural
           Networks  реалізовані  засоби  для  підгонки  лінійних  моделей
           (див. розділ про лінійні мережі, а також матеріал по модулю
           Множинна регресія системи STATISTICA).
                У багатьох реальних завданнях доводиться мати справу з
           не  цілком  достовірними  даними.  Значення  деяких  змінних
           можуть бути спотворені шумом або частково бути відсутнім.
           Пакет ST Neural Networks має спеціальні засоби роботи з про-
           пущеними значеннями (вони можуть бути замінені на середнє
           значення цієї змінної або на інші її статистики) так, що якщо у
           вас не так багато даних, ви можете включити в розгляд випад-
           ки  з  пропущеними  значеннями  (хоча,  звичайно,  краще  за  це
           уникати).  Крім  того,  нейронні  мережі  в  цілому  стійкі  до
           шумів. Проте у цієї стійкості є межа. Наприклад, викиди, тоб-
           то значення, що лежать дуже далеко  від  області  нормальних
           значень деякої змінної, можуть спотворити результат навчан-
           ня. У таких випадках краще всього постаратися виявити і ви-
           далити  ці  викиди  (або  видаливши  відповідні  спостереження
           або  перетворивши  викиди  в  пропущені  значення).  Якщо  ви-
           киди виявити важко, то можна скористатися наявними в пакеті
           ST  Neural  Networks  можливостями  зробити  процес  навчання
           стійким  до  викидів  (за  допомогою  функції  помилок  типу
           "міських кварталів"),  проте таке стійке до викидів навчання,
           як правило, менш ефективне, чим стандартне.
                Висновки. Вибирайте такі змінні, які, як ви припускаєте,
           впливають на результат.
                З числовими і номінальними змінними в пакеті ST Neural
           Networks можна працювати безпосередньо. Змінні інших типів
           слід перетворити у вказані типи або оголосити незначущими.


                                          14
   9   10   11   12   13   14   15   16   17   18   19