Page 216 - 4511
P. 216
Для цього застосовуємо класичний метод К- середніх і
його узагальнений аналог, реалізований в модулі Data Mining.
Вихідні дані. Маєтмо файл землетруси.sta - таблиця да-
них STATISTICA, в якій представлені дані про 428 землетрусів.
Дані охарактеризовані 4 параметрами :
• широта, довгота - координати землетрусів;
• глибина - глибина вогнища;
• магнітуда.
Всі кластерні алгоритми потребують оцінках відстаней
між кластерами або об'єктами, і ясно , що при обчисленні відс-
тані необхідно задати масштаб вимірювань.
Оскільки різні вимірювання використовують абсолютно
різні типи шкал, дані необхідно стандартизувати (в меню Data
виберіть пункт Standardiza), так що кожна змінна буде мати се-
редню 0 і стандартне відхилення 1.
Рисунок 9.22. Діалог для стандартизації змінних
Фрагмент таблиці зі стандартизованими змінними наве-
дено нижче.
215