Page 129 - 4496
P. 129

Приклад 3. Якщо для кодування зон вибрати 5 знаків
                            допоміжного алфавіту, а інші 11 знаків використовувати для
                            кодування алфавіту тексту, то такий розподіл дає можливість
                            одержати 55 варіантів. Цього може бути достатнім для
                            кодування всіх цифр, розділових знаків та літер українського
                            алфавіту.
                                  Приклад 4. Розглянуті вище приклади базуються на 4-
                            бітовому двійковому поданні знаків допоміжного алфавіту,
                            що дає можливість використовувати 16 знаків для кодування
                            зон та алфавіту тексту. Якщо взяти за основу 5-бітове
                            двійкове подання знаків допоміжного алфавіту, то це дасть
                            можливість використовувати 32-значний допоміжний алфавіт.
                            При цьому розбиття алфавіту тексту на дві зони дасть
                            можливість одержати 2  30 = 60 варіантів кодів.
                                  Метод зонного стиснення полягає в слідуючому: якщо
                            сусідні знаки стискуваного тексту знаходяться в одній і тій же
                            зоні, то зону указують один раз перед першим знаком, а решту
                            знаків записують без вказівки зони.
                                  Наприклад, якщо взяти за основу систему кодування,
                            запропоновану у прикладі 1, то текст "agif kjkuvznuw", що
                            потребує для свого зберігання 14 байт, може бути стиснутий
                            до вигляду "E17960BABF78C079", для зберігання якого
                            потрібно тільки 8 байт, з яких 1 байт використовується для
                            зберігання двох кодів зон, а 7 байт - для зберігання 14 кодів
                            знаків алфавіту тексту.
                                  Тепер розіб’ємо алфавіт тексту на зони інакше.
                            Припустимо, що зона "E" включає знак "пропуск", а також
                            літери "a".."f" і "n".."s", зона "F" включає літери "g".."m" і
                            "t".."z". Той же текст за таких умов може бути стиснутий до
                            вигляду
                                  "E1F02E60F43489DE7F8A",
                                  для зберігання якого потрібно вже 10 байт, з яких 3
                            байти використовується для зберігання 6 кодів зон, а інші 7
                            байтів, як і раніше, використовуються для зберігання 14 кодів
                            знаків алфавіту тексту.
                                  Даний приклад показує, що ефективність стиснення
                            залежить від того, на скільки вдало розподілені знаки
                            алфавіту тексту по зонам. При розподілі по зонам треба
                            добиватись того, щоб знаки алфавіту, що належать одній і тій
                            же    зоні,    утворювали     якнайдовші      послідовності     у
                                                           126
   124   125   126   127   128   129   130   131   132   133   134