Page 187 - 4511
P. 187

(1)    мінімізувати мінливість усередині кластерів;
           (2)    максимізувати мінливість між кластерами.
                Цей спосіб аналогічний методу "ANOVA навпаки" в тому
           сенсі, що критерій значущості в методі ANOVA порівнює між-
           групову мінливість з внутрішньогруповою при перевірці гіпо-
           тези про те, що середні в групах відрізняються один від одного.
           У кластеризації методом К - середніх програма переміщає об'є-
           кти (тобто спостереження) з одних груп (кластерів) в інші для
           того, щоб отримати найбільш значущий результат відповідно
           до критерію ANOVA. Результати ANOVA є частиною стандар-
           тного виведення кластерного аналізу К-средніми.
                Зазвичай, коли результати кластерного аналізу К - серед-
           німи отримані, можна розрахувати середні для кожного клас-
           тера по кожному виміру, щоб оцінити, наскільки кластери роз-
           різняються один від одного. В ідеалі ви повинні отримати сере-
           дні, що сильно розрізняються для більшості, якщо не для усіх
           вимірів, використовуваних в аналізі. Значення  F -статистики,
           отримані для кожного виміру, є іншим індикатором того, наскі-
           льки добре відповідний вимір дискримінує кластери.
                У рамках програми STATISTICA використовуються пра-
           вила об'єднання або зв'язку, вживані для ієрархічної деревови-
           дної кластеризації. Це: просте зв'язування, повне зв'язування,
           правила зваженого і незваженого групового середнього, зваже-
           ного і незваженого центроїда і метод Варда.
                Метод EM (Expectation Maximization). Метод EM (мак-
           симізація очікування) розширює цей основний підхід до групу-
           вання в двох важливих шляхах:
              1.  Замість призначення випадків або спостережень класте-
                  рам, щоб максимізувати відмінності в середніх для без-
                  перервних змінних, алгоритм кластеризації EM обчис-
                  лює вірогідність кластерних членств, заснованих на од-
                  ному або більше розподілах вірогідності. Мета алгоритм
                  кластеризації EM алгоритму - максимізувати повну віро-
                  гідність або вірогідність даних, що отримати остаточні
                  (фінальні) кластери.
              2.  На відміну від класичного виконання групування К-се-
                  редніх, основний алгоритм ЕМ може бути застосований




                                            186
   182   183   184   185   186   187   188   189   190   191   192