Page 14 - 4703
P. 14
знадобитися величезне число спостережень. Ця складність
відома як "прокляття розмірності" і ми обговоримо її далі в
цій главі.
Для більшості реальних завдань буває досить декількох
сотень або тисяч спостережень. Для особливо складних зав-
дань може знадобитися ще більша кількість, проте дуже рідко
може зустрітися (навіть тривіальне) завдання, де вистачило б
менше сотні спостережень. Якщо даних менше, ніж тут сказа-
но, то насправді у вас недостатньо інформації для навчання
мережі, і краще, що ви можете зробити - це спробувати
підігнати до даних деяку лінійну модель. У пакеті ST Neural
Networks реалізовані засоби для підгонки лінійних моделей
(див. розділ про лінійні мережі, а також матеріал по модулю
Множинна регресія системи STATISTICA).
У багатьох реальних завданнях доводиться мати справу з
не цілком достовірними даними. Значення деяких змінних
можуть бути спотворені шумом або частково бути відсутнім.
Пакет ST Neural Networks має спеціальні засоби роботи з про-
пущеними значеннями (вони можуть бути замінені на середнє
значення цієї змінної або на інші її статистики) так, що якщо у
вас не так багато даних, ви можете включити в розгляд випад-
ки з пропущеними значеннями (хоча, звичайно, краще за це
уникати). Крім того, нейронні мережі в цілому стійкі до
шумів. Проте у цієї стійкості є межа. Наприклад, викиди, тоб-
то значення, що лежать дуже далеко від області нормальних
значень деякої змінної, можуть спотворити результат навчан-
ня. У таких випадках краще всього постаратися виявити і ви-
далити ці викиди (або видаливши відповідні спостереження
або перетворивши викиди в пропущені значення). Якщо ви-
киди виявити важко, то можна скористатися наявними в пакеті
ST Neural Networks можливостями зробити процес навчання
стійким до викидів (за допомогою функції помилок типу
"міських кварталів"), проте таке стійке до викидів навчання,
як правило, менш ефективне, чим стандартне.
Висновки. Вибирайте такі змінні, які, як ви припускаєте,
впливають на результат.
З числовими і номінальними змінними в пакеті ST Neural
Networks можна працювати безпосередньо. Змінні інших типів
слід перетворити у вказані типи або оголосити незначущими.
14