Page 207 - 4496
P. 207

де X, Y - двійкові вектори, Х t, У t - транспоновані вектори
                            (вектори-рядки).
                                  При    обчисленні     ознак    можливі     помилки,     які
                            спотворюють істинне значення вектора і можуть привести до
                            невірної   класифікації.    При    цьому    одиночна    помилка
                            приводить    до   спотворення     будь-якого   одного    розряду
                            двійкового вектора, подвійна - будь-яких двох розрядів і т.д.
                            Хай для класифікації вибрано n двійкових ознак, а попередні
                            експерименти показують, що одиночні, подвійні і навіть
                            потрійні помилки мають помітну величину, а помилками
                            більшої кратності можна нехтувати через їх малу вірогідність.
                            Оцінимо     розміри   кластерів   і   знайдемо    грубу   оцінку
                            можливого числа кластерів за наявності n ознак.
                                  Вектор одиночної помилки є двійковим n-розрядним
                            кодом, що містить одну одиницю (решта розрядів нульова).
                            Вектор подвійної помилки містить дві одиниці, вектор
                            потрійної помилки - 3 одиниці. Загальне число векторів
                            одиночних, подвійних і потрійних помилок рівне:




                                  Якщо помножити набуте значення числа векторів
                            помилок на можливе число кластерів, то одержане число
                            повинен бути істотно менше ніж загальна кількість n-
                            розрядних векторів. З цих міркувань одержуємо оцінку:




                                  Звідки число можливих кластерів:




                                  Так, при n = 10 число кластерів K << 7.
                                  Аналогічні оцінки використовуються для визначення
                            меж в теорії кодування.

                                  5.19.7 Теорія графів



                                                           204
   202   203   204   205   206   207   208   209   210   211