Page 119 - 4496
P. 119
Приклад. Розглянемо той же кодований текст
100011101011101111011 при n=7 і k=3. При цьому
утворюються фрагменти 1000111, 0101110, 1111011.
Виконуємо додавання цих фрагментів
1000111 0101110 1111011 = 0010010. Утворюється
стиснуте кодове слово 0010010.
Для розглянутих способів стиснення можливі випадки,
коли для різних фрагментів утворюється одне й те ж стиснуте
кодове слово, але імовірність цього дуже мала. Наприклад,
для словника на N=1100 слів при n=30 двійкових розрядів
імовірність неоднозначного кодування складає близко 0.0005.
Спосіб Курбакова-Смирнова. Спосіб полягає в тому, що
стиснуті кодові слова утворюють безпосередньо із двійкових
еквівалентів слів даного тексту шляхом додавання по модулю
2.
Для прикладу розглянемо слово «газета», двійкові
еквіваленти літер якого за таблицею кодів ASCII такі: “г” -
10100011, “а” - 10100000, “з” - 10100111, “е” - 10100101, “т” -
11100010. При цьому m=8.
За даним способом стиснення здійснюється шляхом
додавання по модулю 2 двійкових еквівалентів окремих літер
з одночасним політерним зсувом:
1 0 1 0 0 0 0 0 “а”
1 1 1 0 0 0 1 0 “т”
1 0 1 0 0 1 0 1 “е”
1 0 1 0 0 1 1 1 “з”
1 0 1 0 0 0 0 0 “а”
1 0 1 0 0 0 1 1 “г”
- - - - - - - - - - - - - - - - - - - - - - -
1 1 1 0 0 0 1 1 1 0 1 1 1 - стиснуте кодове слово
довжиною n=13.
Метод цікавий тим, що дозволяє досить просто
враховувати обмеження довжини стиснутих кодових слів.
Наприклад, якщо n max=11, то для указаного слова n> n max, і
тому останні його літери додають по модулю 2 без
політерного зсуву:
1 0 1 0 0 0 0 0 “а”
1 1 1 0 0 0 1 0 “т”
1 0 1 0 0 1 0 1 “е”
1 0 1 0 0 1 1 1 “з”
116