Page 68 - 4268
P. 68

factor1,  factor2)  представлятиме  собою  безперервну  функцію.  І
            тоді,  побудувавши  для  кожного  з  кластерів  окрему  нейронну
            мережу, ми побудуємо модель фізичного процесу.
                  Для  вирішення  поставленої  задачі  спочатку  необхідно

            зрозуміти,  як  буде  проводитися  порівняння  об'єктів.  Інакше
            кажучи, в даному просторі (x, y, factor1, factor2) потрібно ввести
            кількісну  міру  подібності  між  об'єктами.  У  нашому  випадку

            здається  зручним  введення  метрики  -  евклідова  відстань,  яка
            обчислюється  як  корінь  з  суми  квадратів  покоординатного
            різниць.
                  Однак, введення метрики - це ще не все. Часто буває так, що

            різні  незалежні  змінні  вимірюються  в  різних  шкалах  з  різними
            діапазонами.  Відповідно,  не  обговоривши  додаткових  умов,
            можна  отримати  неякісне  рішення:  вплив  великої  кількості

            змінних  на  результат  кластеризації  упущений.  Дійсно,  якщо
            значення  однієї  змінної  вимірюються  в  сотнях  і  змінюються  в
            межах  десяти,  у  той  час  як  інша  змінна  в  середньому  дорівнює

            нулю  і  змінюється  в  межах  одиниці,  то  внесок  останньої  в
            евклідів  відстань  буде  дуже  малим.  Щоб  уникнути  подібних
            неприємностей  проводять  процедуру  стандартизації  змінних.

            Результатом стандартизації є приведення всіх змінних до єдиної
            шкали: дані змінюються в межах нуля в діапазоні ± 3, причому
            більша  частина  всіх  значень  буде  належати  інтервалу  (-1,  1).
            Дуже важливо, що процедура стандартизації не змінює структуру

            взаємодій  між  змінними. Відповідно,  стандартизація  не  впливає
            на структуру кластерів.
                  Для  того,  щоб  провести  стандартизацію  змінної  необхідно

            виділити відповідний стовпець, натиснути праву кнопку миші, з
            контекстного  меню  вибрати  розділ  Fill  /  Standardize  Block  -
            Заповнити  /  стандартизувати  Блок  і  виконати  команду  меню
            Standardize  Columns  -  стандартизовані  стовпці.  Цю  процедуру

            необхідно виконати для змінних x і y.
                  Варто звернути увагу на те, що стандартизація застосовна до
            змінних,  вимірюваним  у  безперервної  шкалою.  У  нашому

            прикладі  присутні  дві  категоріальні  змінні.  Змінна  factor1,  що
            приймає  значення  тільки  (s,  m)  і  змінна  factor2,  значення  якої
            можуть  бути  тільки  (l,  d).  За  замовчуванням  система

            STATISTICA рівням факторів цих змінних привласнила значення


                                                         68
   63   64   65   66   67   68   69   70   71   72   73