Архівація даних і програми стискування

Програми-архіватори можна розділити на три категорії.

  1. 1. Програми, використовувані для стискування виконуваних файлів, причому всі файли, які прошлі стискування, вільно запускаються, але зміна їх вмісту, наприклад русифікація, можливі лише після їх разар- хивациі.
  2. 2. Програми, використовувані для стискування мультимедійних файлів, причому можна після стискування ці файли вільно використовувати, хоча, як праві ло, при стискуванні змінюється їх формат (внутрішня структура), а інколи і асоційована з ними програма, що може привести до проблем із за пуском.
  3. 3. Програми, використовувані для стискування будь-яких видів файлів і каталогів, причому в основному використання стислих файлів можливе лише після сле розархівування. Хоча є програми, які "бачать" деяких типів архівів як найзвичайніші каталоги, але вони мають ряд непріят них нюансів, наприклад, сильно навантажують центральний процесор, що виключає їх використання на "слабких машинах".

Принцип роботи архіваторів заснований на пошуку у файлі "надлишкової" ін формації і подальшому її кодуванні з метою здобуття мінімаль ного об'єму. Найвідомішим методом архівації файлів є стискування послідовностей однакових символів. Наприклад, усередині вашого файлу знаходяться послідовності байтів, які часто повторюються. Замість того, щоб зберігати кожен байт, фіксується кількість повторюваних символів і їх позиція. Наприклад, файл, що архівується, займає 15 байт і складається з наступних символів:

У У У У В LLLLLAAAAA

У шістнадцятиричній системі

42 42 42 42 42 4с 4с 4с 4с 4с 41 41 41 41 41

Архіватор може представити цей файл в наступному вигляді (шестнадцате-річном):

01 05 42 06 05 4с 0а 05 41

Це означає: з першої позиції п'ять разів повторюється символ "В", з позиції 6 п'ять разів повторюється символ " L " і з позиції 11 п'ять разів повторюється сім віл "А". Для зберігання файлу в такій формі буде потрібно всього 9 байт, що на 6 байт менше початкового.

Описаний метод є простим і дуже ефективним способом сжа тія файлів. Проте він не забезпечує великої економії об'єму, якщо оброблюваний текст містить невелика кількість послідовностей символів, що повторюються.

Витонченіший метод стискування даних, використовуваний в тому або іншому вигляді практично будь-яким архіватором, — це так званий оптимальний префіксний код і, зокрема, кодування символами змінної довжини (алгоритм Хаффмана).

Код змінної довжини дозволяє записувати найбільш символи, що часто зустрічаються, і групи символів всього лише декількома бітами, тоді як рідкі символи і фрази будуть записані довшими бітовими рядками. Наприклад, в будь-якому англійському тексті буква Е зустрічається частіше, ніж Z, а X і Q відносяться до що найменш зустрічається. Таким чином, іс пользуя спеціальну таблицю відповідності, можна закодувати кожну букву Е меншим числом бітів і використовувати довший код бо леї рідких букв. Популярні архіватори ARJ, РАК, PKZIP працюють на основі алгоритму Лемпела-зіва. Ці архіватори класифікуються як адаптивні словарні кодувальники, в яких текстові рядки замінюються покажчиками на ідентичні їм рядки, що зустрічаються раніше в тексті. Наприклад, всі слова какой- нібудь книги можуть бути представлені у вигляді номерів сторінок і номерів рядків деякого словника. Найважливішою відмінною рисою цього алгоритму є використання граматичного розбору попереднього тексту з розташуванням його на фрази, які записуються в словник. Покажчики дозволяють зробити заслання на будь-яку фразу у вікні встановленого розміру, передування поточній фразі. Якщо відповідність знайдена, поточна фраза замінюється покажчиком на свого попереднього двійника.

При архівації, як і при тому, що компресує, міра стискування файлів силь але залежить від формату файлу. Графічні файли, типа TIF і GIF, вже за раніше компресують (хоча існує різновид формату TIFF і без компресії), і тут навіть самий кращий архіватор мало чого знайде для упаковки. Зовсім інша картина спостерігається при архівації текстових файлів, файлів Postscript, файлів BMP і подібних до них.

 
Бытовая техника
 

::  Меню ::

 

Передмова
Введення

Що робити, якщо комп'ютер погано працює?

Діагностичні повідомлення BIOS

Діагностичні повідомлення операційної системи

Діагностичні програми

Ви купили комп'ютер

Живлення комп'ютера і його компонентів

Перше включення

Установка операційної системи

Налаштування операційної системи

Установка програм і ігор

Налаштування програм і ігор

Видалення програм і ігор

Робота з файлами і каталогами

Робота з офісними програмами

Мультимедійні функції комп'ютера

Робота в мережі Інтернет

Робота в локальній мережі

Комп'ютерні віруси

Зависання операційної системи

Підключення нових пристроїв


 

:: Реклама ::::

 
  Настройка і оптимізація комп'ютера
 

 

:: Статистика ::

 
Індекс цитування

 

 

 


 

Copyright © Asentli, 2008