Page 13 - 4703
P. 13
ST Neural Networks ви можете довільно вибирати змінні і
відміняти попередній вибір; крім того, система ST Neural
Networks уміє сама дослідним шляхом відбирати корисні
змінні. Спершу має сенс включити усі змінні, які, на вашу
думку, можуть впливати на результат - на подальших етапах
можна скоротити число змінних.
Нейронні мережі можуть працювати з числовими дани-
ми, що лежать в певному обмеженому діапазону. Це створює
проблеми у випадках, коли дані мають нестандартний мас-
штаб, або коли в них є пропущені значення, і коли дані є нечи-
словими. У пакеті ST Neural Networks є засоби, що дозволяють
впоратися з усіма цими труднощами. Числові дані масштабу-
ються у відповідний для мережі діапазон, а пропущені значен-
ня можна замінити на середнє значення (чи на іншу статисти-
ку) цієї змінної по усіх наявних навчальних прикладах (Bishop,
1995).
Важчим завданням є робота з даними нечислового ха-
рактеру. Найчастіше нечислові дані бувають представлені у
вигляді номінальних змінних типу Стать ={Чоловік, Жінка}.
Змінні з номінальними значеннями можна представити в чис-
ловому виді, і в системі ST Neural Networks є засоби для робо-
ти з такими даними. Проте, нейронні мережі не дають добрих
результатів при роботі з номінальними змінними, які можуть
набувати багато різних значень.
Нечислові дані інших типів можна або перетворити в
числову форму або оголосити незначущими. Значення дат і
часу, якщо вони потрібні, можна перетворити в числові,
віднімаючи з них початкову дату (час). З довільними тексто-
вими полями (наприклад, прізвищами людей) працювати не
можна і їх треба зробити незначущими.
Питання про те, скільки спостережень треба мати для
навчання мережі, часто виявляється непростим. Відомий ряд
евристичних правил, що пов'язують число необхідних спосте-
режень з розмірами мережі (просте з них свідчить, що число
спостережень має бути вдесятеро більше числа зв'язків в ме-
режі). Насправді це число залежить також від (заздалегідь
невідомої) складності того відображення, яке нейронна мере-
жа прагне відтворити. З ростом кількості змінних кількість
необхідних спостережень росте нелінійно, так що вже при до-
сить невеликому (наприклад, п'ятдесят) числі змінних може
13