Page 119 - 4496
P. 119

Приклад.     Розглянемо    той    же    кодований    текст
                            100011101011101111011       при    n=7   і   k=3.   При    цьому
                            утворюються      фрагменти     1000111,     0101110,    1111011.
                            Виконуємо            додавання          цих          фрагментів
                            1000111   0101110   1111011     =    0010010.    Утворюється
                            стиснуте кодове слово 0010010.
                                  Для розглянутих способів стиснення можливі випадки,
                            коли для різних фрагментів утворюється одне й те ж стиснуте
                            кодове слово, але імовірність цього дуже мала. Наприклад,
                            для словника на N=1100 слів при n=30 двійкових розрядів
                            імовірність неоднозначного кодування складає близко 0.0005.
                                  Спосіб Курбакова-Смирнова. Спосіб полягає в тому, що
                            стиснуті кодові слова утворюють безпосередньо із двійкових
                            еквівалентів слів даного тексту шляхом додавання по модулю
                            2.
                                  Для прикладу розглянемо слово «газета», двійкові
                            еквіваленти літер якого за таблицею кодів ASCII такі: “г” -
                            10100011, “а” - 10100000, “з” - 10100111, “е” - 10100101, “т” -
                            11100010. При цьому m=8.
                                  За даним способом стиснення здійснюється шляхом
                            додавання по модулю 2 двійкових еквівалентів окремих літер
                            з одночасним політерним зсувом:
                                   1 0 1 0 0 0 0 0                        “а”
                                      1 1 1 0 0 0 1 0                     “т”
                                        1 0 1 0 0 1 0 1                   “е”
                                          1 0 1 0 0 1 1 1                 “з”
                                             1 0 1 0 0 0 0 0              “а”
                                               1 0 1 0 0 0 1 1            “г”
                                   - - - - - - - - - - - - - - - - - - - - - - -
                                   1 1 1 0 0 0 1 1 1 0 1 1 1 - стиснуте кодове слово
                            довжиною n=13.
                                   Метод цікавий тим, що дозволяє досить просто
                            враховувати обмеження довжини стиснутих кодових слів.
                            Наприклад, якщо n max=11, то для указаного слова n> n max, і
                            тому останні його літери додають по модулю 2 без
                            політерного зсуву:
                                   1 0 1 0 0 0 0 0                   “а”
                                   1 1 1 0 0 0 1 0                   “т”
                                   1 0 1 0 0 1 0 1                   “е”
                                      1 0 1 0 0 1 1 1                “з”
                                                           116
   114   115   116   117   118   119   120   121   122   123   124