Page 187 - 4511

P. 187

(1) мінімізувати мінливість усередині кластерів;
(2) максимізувати мінливість між кластерами.
Цей спосіб аналогічний методу "ANOVA навпаки" в тому
сенсі, що критерій значущості в методі ANOVA порівнює між-
групову мінливість з внутрішньогруповою при перевірці гіпо-
тези про те, що середні в групах відрізняються один від одного.
У кластеризації методом К - середніх програма переміщає об'є-
кти (тобто спостереження) з одних груп (кластерів) в інші для
того, щоб отримати найбільш значущий результат відповідно
до критерію ANOVA. Результати ANOVA є частиною стандар-
тного виведення кластерного аналізу К-средніми.
Зазвичай, коли результати кластерного аналізу К - серед-
німи отримані, можна розрахувати середні для кожного клас-
тера по кожному виміру, щоб оцінити, наскільки кластери роз-
різняються один від одного. В ідеалі ви повинні отримати сере-
дні, що сильно розрізняються для більшості, якщо не для усіх
вимірів, використовуваних в аналізі. Значення F -статистики,
отримані для кожного виміру, є іншим індикатором того, наскі-
льки добре відповідний вимір дискримінує кластери.
У рамках програми STATISTICA використовуються пра-
вила об'єднання або зв'язку, вживані для ієрархічної деревови-
дної кластеризації. Це: просте зв'язування, повне зв'язування,
правила зваженого і незваженого групового середнього, зваже-
ного і незваженого центроїда і метод Варда.
Метод EM (Expectation Maximization). Метод EM (мак-
симізація очікування) розширює цей основний підхід до групу-
вання в двох важливих шляхах:
1. Замість призначення випадків або спостережень класте-
рам, щоб максимізувати відмінності в середніх для без-
перервних змінних, алгоритм кластеризації EM обчис-
лює вірогідність кластерних членств, заснованих на од-
ному або більше розподілах вірогідності. Мета алгоритм
кластеризації EM алгоритму - максимізувати повну віро-
гідність або вірогідність даних, що отримати остаточні
(фінальні) кластери.
2. На відміну від класичного виконання групування К-се-
редніх, основний алгоритм ЕМ може бути застосований

186

182 183 184 185 186 187 188 189 190 191 192