Différence entre GZIP et BZIP2

GZIP vs BZIP2

GNU zip (également appelé GZIP) est un logiciel permettant de compresser des fichiers. À l'origine, il était destiné à remplacer le programme de compression utilisé dans les premiers systèmes Unix - à utiliser dans le projet GNU (projet de logiciel libre)..

BZIP2 est un algorithme de compression de données sans perte open source - à la base, une classe d'algorithmes de compression de données qui permet aux données d'origine d'un fichier compressé d'être complètement reconstruites à partir des données compressées..

GZIP est basé sur un algorithme appelé DEFLATE. C'est aussi un algorithme de compression de données sans perte. Il utilise à la fois l'algorithme LZ77 et le codage de Huffman. Essentiellement, GZIP fait référence au format de fichier du même nom. Ce format est un en-tête de 10 octets contenant un nombre magique (ce qui signifie une valeur numérique ou textuelle qui ne change jamais. Il est utilisé pour désigner un format de fichier ou un protocole, une valeur numérique non nommée qui ne change jamais ou des valeurs distinctes qui ne peuvent être confondues. pour tout le reste), en-têtes supplémentaires éventuellement nécessaires (nom de fichier d'origine, par exemple), corps contenant une charge compressée avec DEFLATE (qui sont les données transportées par les en-têtes) et pied de page de 8 octets. qui contient une somme de contrôle CRC-32, ainsi que la longueur réelle des données non compressées d'origine.

Le format BZIP2 utilise diverses techniques de compression, qui sont empilées les unes sur les autres en plusieurs couches. Ils se produisent dans un ordre très distinctif: codage de longueur d'exécution (qui est une séquence de quatre à 255 symboles en double remplacés par les quatre premiers symboles et une longueur de codage qui se répète entre 0 et 251), transformation de Burrows-Wheeler ( qui est la sorte de bloc réversible qui constitue le cœur même du BZIP2), Move to front (ne modifie pas la taille du bloc traité), Encodage en longueur (qui consiste en de longs brins de symboles - généralement des zéros - qui répétez dans la sortie et sont remplacés à la fois par le symbole et par une séquence de deux codes), le codage de Huffman (processus qui remplace les symboles de longueur fixe d’octets sur 8 bits par des codes de longueur variable), le codage multiple de Hoffman (composé de plusieurs tables de Hoffman de taille identique), codage Unary en base 1, codage Delta et matrice de bits fragmentés.

Résumé:

1. GZIP est une application gratuite utilisée pour compresser des fichiers. BZIP2 est un algorithme de compression de données open source sans perte qui permet de récupérer les données d'origine d'un fichier compressé..

2. GZIP comprend un en-tête de 10 octets, des en-têtes facultatifs, un corps et un pied de page de 8 octets; BZIP2 comprend pas moins de neuf couches de techniques de compression.