Page 69 - 4268
P. 69
(101, 102). Для дотримання коректності подальших процедур ці
змінні необхідно перекодувати, так, щоб діапазон їх зміни
відповідав діапазону зміни безперервних змінних.
Для того, щоб перекодувати категоріальну змінну, необхідно
двічі кликнути на її назві в Таблиці даних і в діалоговому вікні
специфікацій змінних натиснути кнопку Text Labels - Текстові
мітки.
Рисунок 7.12. Зміна значень рівнів факторів категоріальної
змінної.
У розділі Numeric - Число діалогового вікна Text Labels
Editor - Редактор текстових міток необхідно поставити значення -
1 і 1. Дану перекодування необхідно провести для обох
категоріальних змінних factor1 і factor2. Таким чином, середнє
категоріальних змінних так само дорівнює нулю, а діапазон
значень порівняємо з діапазоном зміни безперервних змінних.
Варто відзначити, що округлений до цілих результат формальної
стандартизації категоріальних змінних призводить до того ж
результату. Проте, якщо просто виконати стандартизацію
категоріальних змінних, текстові значення будуть загублені, що
може привести до некоректних результатів.
"На скільки кластерів ділити дані?" - Найважливіший, і часом
не тривіальне запитання кластерного аналізу. Добре якщо
експерти, постійно спостерігають за процесом, мають уявлення
про його природу і можуть імовірно вказати на число кластерів.
Але часто доводиться стикатися з випадками, коли апріорі судити
про кількість кластерів не можуть навіть фахівці. У таких
ситуаціях неоціненну послугу може надати агломеративні метод
ієрархічної класифікації, або ієрархічний кластерний аналіз.
69