Page 16 - 4703
P. 16
видно, що при рішенні реальних завдань методами нейронних
мереж потрібно етапи попередньої обробки - пре-процесування
- і завершальної обробки - пост-процесування даних.
Відповідні засоби є в пакеті ST Neural Networks. Тут треба
розглянути два питання:
Шкалювання. Числові значення мають бути приведені в
масштаб, відповідний для мережі. Зазвичай початкові дані
масштабуються за лінійною шкалою. У пакеті ST Neural
Networks реалізовані алгоритми мінімакса і середньо-
го/стандартного відхилення, які автоматично знаходять мас-
штабуючі параметри для перетворення числових значень в
потрібний діапазон.
В деяких випадках більше відповідним може виявитися
нелінійне шкалювання (наприклад, якщо заздалегідь відомо,
що змінна має експоненціальний розподіл, має сенс узяти її
логарифм). Нелінійне шкалювання не реалізоване в модулі ST
Neural Networks. Ви можете прошкалювати змінну засобами
перетворення даних базової системи STATISTICA, а потім
працювати з нею в модулі ST Neural Networks.
Номінальні змінні. Номінальні змінні можуть бути дво-
значними (наприклад, Стать={Чоловік, Жінка}) або багато-
значними (тобто набувати більше двох значень або станів).
Двозначну номінальну змінну легко перетворити в числову
(наприклад, Чоловік=0, Жінка=1). З багатозначними
номінальними змінними справа йде складніше. Їх теж можна
представити одним числовим значенням (наприклад, Соба-
ка=0, Вівця=1, Кішка=2), проте при цьому виникне (можливо)
неправильне впорядковування значень номінальної змінної: в
розглянутому прикладі Вівця виявиться чимось середнім між
Собакою і Кішкою.
Існує точніший спосіб, відомий як кодування 1-із-N, в
якому одна номінальна змінна представляється декількома
числовими змінними. Кількість числових змінних дорівнює
числу можливих значень номінальної змінної; при цьому вся-
кий раз рівно одна з N змінних набуває ненульового значення
(наприклад, Собака ={1,0,0}, Вівця ={0,1,0}, Кішка ={0,0,1}).
У пакеті ST Neural Networks є можливості перетворювати як
двох-, так і багатозначні номінальні змінні для подальшого
використання в нейронній мережі. На жаль, номінальна змінна
з великим числом можливих станів зажадає при кодуванні ме-
16