Page 40 - 6151
P. 40
Архівацію файлів застосовують для зменшення їх розмірів при
підготовці до передачі по каналах електронних мереж або до
транспортування на зовнішньому носії малої місткості, наприклад на
гнучкому диску.
Архівацію папок використовують як засіб стиснення даних перед
тривалим зберіганням, зокрема, при резервному копіюванні.
Архівація дисків служить цілям підвищення ефективності
використання їх робочого простору і, як правило, застосовується до дисків,
що мають недостатню місткість.
Незважаючи на достаток алгоритмів стиснення даних, теоретично є
тільки три способи зменшення їх надлишку:
зміна вмісту даних;
зміна структури даних;
зміна змісту і структури даних.
Якщо при стисненні даних відбувається зміна їх вмісту, метод
стиснення безповоротний і при відновленні даних з стиснутого файлу не
відбувається повного відновлення початкової послідовності. Такі методи
називають також методами стиснення з регульованою втратою інформації.
Вони застосовні тільки для тих типів даних, для яких формальна втрата
частини змісту не приводить до значного зниження споживчих
властивостей. Насамперед, це відноситься до мультимедійних даних:
відео-рядів, музичних записів, звукозаписів і малюнків. Методи стиснення
з втратою інформації звичайно забезпечують набагато більш високу
ступінь стиснення, ніж оборотні методи, але їх не можна застосовувати до
текстових документів, баз даних і, тим більше, до програмного коду.
Характерними форматами стиснення з втратою інформації є:
.JPG для графічних даних;
.MPG для відео-даних;
.МР3 ля звукових даних.
Якщо при стисненні даних відбувається тільки зміна їх структури, то
метод стиснення оборотний. З результуючого коду можна відновити
початковий масив шляхом застосування зворотного методу. Оборотні
методи застосовують для стиснення будь-яких типів даних. Характерними
форматами стиснення без втрати інформації є:
.GIF, .TIF, .PCX та ін (графічні дані);
.AVI для відеоданих;
.ZIP, RJ, .RAR, .LZH, .LH, .CAB та ін (будь-які дані).
Алгоритми стиснення даних
В основу алгоритмів RLE (Кодування довжин серій (англ. Run-length
encoding, RLE) або Кодування повторів — простий алгоритм стиснення
даних, який оперує серіями даних, тобто послідовностями, в яких один і
41