Ero GZIP n ja BZIP2 n välillä

GZIP vs. BZIP2

GNU zip (tunnetaan myös nimellä GZIP) on ohjelmistosovellus, jonka tarkoituksena on pakata tiedostoja. Alun perin se oli tarkoitettu korvaamaan aikaisissa Unix-järjestelmissä käytetty pakkausohjelma - käytettäväksi GNU-projektissa (ilmainen ohjelmistoprojekti).

BZIP2 on avoimen lähdekoodin häviöttömän datan pakkausalgoritmi - pohjimmiltaan tietojen pakkausalgoritmien luokka, jonka avulla pakatun tiedoston alkuperäiset tiedot voidaan rekonstruoida kokonaan pakatusta tiedosta.

GZIP perustuu algoritmiin, joka tunnetaan nimellä DEFLATE. Tämä on myös häviötön tietojen pakkausalgoritmi. Se käyttää sekä LZ77-algoritmia että Huffman-koodausta. Pohjimmiltaan GZIP viittaa saman nimen tiedostomuotoon. Tämä muoto on 10 tavun otsikko, joka sisältää maagisen numeron (mikä tarkoittaa numeerista tai tekstiarvoa, joka ei koskaan muutu ja jota käytetään merkitsemään tiedostomuoto tai protokolla, nimeämätön numeerinen arvo, joka ei koskaan muutu, tai erilliset arvot, joita ei voida erehtyä) mille tahansa muulle), ylimääräiset otsikot, jotka saattavat olla tarpeen tai joita ei välttämättä tarvita (esimerkiksi alkuperäinen tiedostonimi), runko, joka sisältää DEFLATE-pakatun hyötykuorman (joka on tieto, jota otsikot kantavat), ja 8 tavun alatunniste joka sisältää CRC-32-tarkistussumman ja alkuperäisen pakkaamattoman datan todellisen pituuden.

BZIP2-muodossa käytettäviä pakkaustekniikoita on useita, ja ne on pinottu toistensa päälle useina kerroksina. Ne esiintyvät hyvin erottuvassa järjestyksessä: Ajonpituuskoodaus (joka on mikä tahansa sarja, joka koostuu neljästä - 255: n kaksoiskappaleen symbolista, joka korvataan neljällä ensimmäisellä symbolilla, ja koodauksen pituus, joka toistuu välillä 0 - 251), Burrows-Wheeler-muunnos ( joka on käännettävä lohkotyyppi, joka muodostaa BZIP2: n ytimen), siirrä eteenpäin (jättää prosessoidun lohkon koon muuttumattomaksi), ajonpituuden koodaus (joka koostuu pitkistä merkkijonoista - yleensä noloista -, jotka jatkuvasti toista ulostulossa ja korvataan sekä symbolilla että kahden koodin sekvenssillä), Huffman-koodaus (joka on prosessi, joka korvaa 8-bittisten tavujen kiinteät pituusmerkit muuttuvilla pituuskoodeilla), useita Hoffman-koodauksia (jotka koostuvat useita samankokoisia Hoffman-taulukoita), Unary base 1 -koodaus, Delta-koodaus ja harvabittiryhmä.

Yhteenveto:

1. GZIP on ilmainen sovellus, jota käytetään tiedostojen pakkaamiseen; BZIP2 on avoimen lähdekoodin häviöttömän datan pakkausalgoritmi, jonka avulla on mahdollista hakea pakatun tiedoston alkuperäiset tiedot.

2. GZIP koostuu 10 tavun otsikosta, valinnaisista otsikoista, rungosta ja 8 tavun alatunnisteesta; BZIP2 koostuu vähintään yhdeksästä pakkaustekniikan kerroksesta.