Page 216 - 4511
P. 216

Для  цього  застосовуємо  класичний  метод  К-  середніх  і
           його узагальнений аналог, реалізований в модулі Data Mining.

                Вихідні дані. Маєтмо файл землетруси.sta - таблиця да-
           них STATISTICA, в якій представлені дані про 428 землетрусів.
           Дані охарактеризовані 4 параметрами :
                • широта, довгота - координати землетрусів;
                • глибина - глибина вогнища;
                • магнітуда.

                Всі  кластерні  алгоритми  потребують  оцінках  відстаней
           між кластерами або об'єктами, і ясно , що при обчисленні відс-
           тані необхідно задати масштаб вимірювань.
                Оскільки різні вимірювання використовують абсолютно
           різні типи шкал, дані необхідно стандартизувати (в меню Data
           виберіть пункт Standardiza), так що кожна змінна буде мати се-
           редню 0 і стандартне відхилення 1.
























                     Рисунок 9.22. Діалог для стандартизації змінних

                Фрагмент таблиці зі стандартизованими змінними наве-
           дено нижче.



                                            215
   211   212   213   214   215   216   217   218   219   220   221