Forstå de ulike komprimerings-, krypterings- og arkivformatene
I datatid er arkiv en enkelt fil som lagrer i seg forskjellige filer og mapper. Det finnes flere arkivformater, og hver har sine egne fordeler og ulemper. Noen arkivformater leveres med komprimeringsstøtte (som gjør at filstørrelsen blir mindre) mens andre støtter kryptering. Ja, og du gjettet det, noen arkivformater støtter både komprimering og kryptering. La oss finne ut mer om komprimerings- og krypteringsalgoritmer som brukes og de forskjellige arkivformatene.
Komprimeringsalgoritme
Komprimeringsalgoritme er metoden som brukes av arkivet til å komprimere filene og gjøre den totale filstørrelsen mindre.
1. LZMA / LZMA2
Lempel-Ziv-Markov (LZMA) kjedealgoritmen er en tapsløs datakomprimeringsalgoritme. LZMA bruker en ordbokskomprimeringsalgoritme som benytter komplekse datastrukturer til å kode en bit om gangen.
LZMA2 er en beholder som inneholder både de ukomprimerte og LZMA-komprimerte dataene. Den støtter multi-threaded komprimering og dekomprimering av data. Det kan også komprimere data som ikke er komprimerbar med andre komprimeringsalgoritmer.
2. Burrows-Wheeler Transform Algorithm (BWT)
BWT fungerer ved å permutere en streng med tekst i rekkefølge og komprimere dem ved å erstatte de gjentatte tegnene til symboler.
3. PPM
Prediksjon ved delvis matching (PPM) er en statistisk datakomprimeringsmetode som fungerer ved å bruke sett med tidligere symboler i den ukomprimerte symbolstrømmen for å forutsi neste symbol i strømmen.
4. Deflate
Deflate er en populær datakomprimeringsalgoritme som bruker en kombinasjon av LZ77- og Huffman-kodingsalgoritmer for å komprimere data (kombinere LZMA- og PPM-algoritmer for å produsere mer komprimering). Siden Deflate ikke inneholder implementeringer begrenset av patenter, har det blitt veldig populært og er mye brukt, spesielt i Linux.
Krypteringsalgoritme
La oss nå gå gjennom noen av de populære krypteringsmetodene:
1. DES
Datakryptering Standard bruker private hemmelige nøkler til å kryptere og dekryptere data. Den hemmelige nøkkelen er valgt tilfeldig fra et 56-64-biters adresserom.
2. AES
Advanced Encryption Standard er en krypteringsalgoritme som brukes av de amerikanske byråene for å sikre sensitive data. Du kan kryptere data ved hjelp av 128, 192 og 256 bits kryptering. AES bruker en symmetrisk nøkkelalgoritme som betyr at en fellesnøkkel brukes til kryptering og deretter dekryptering av dataene.
3. Blowfish
Blowfish-krypteringsalgoritmen krypterer arkivene med en 64-biters blokkstørrelse og en variabelnøkkellengde på 32 til 448 bits.
Merk : Det finnes flere andre krypteringsalgoritmer, men de ovennevnte tre er de mest brukte.
Arkivformater
Det finnes ulike arkivformater tilgjengelig. Nedenfor vurderer vi hvert arkivformat ved hjelp av tre parametere - om det støtter komprimering og kryptering, hvilket operativsystem og programvare er tilgjengelig for bruk.
1. Tar
Tape Arkiv (Tar) er et av de eldste arkivformatene. I utgangspunktet ble det brukt til å kombinere og skrive data til sekvensielle båndstasjoner, men ble senere standardisert som et komprimeringsformat. Tar er mest brukt i Linux, og det støtter ikke komprimering eller kryptering. Du kan også bruke den på Windows med installasjon av tilleggsprogramvare. De fleste av de moderne arkiveringsverktøyene støtter dette formatet. Unntakene inkluderer Diskarkiver og KGB-arkiver.
2. GZ
GZ eller GZip er et av de mest populære komprimeringsformatene som brukes i både Windows og Linux. GZip brukte deflat-komprimeringsalgoritmen til å komprimere arkiverte filer. GZip støtter også filoverføringer med flere deler, noe som betyr at du kan lage mindre deler av en stor GZip-fil for enkel deling og overføring. Siden GZip er ganske populær, har de fleste av de moderne arkiveringsverktøyene støtte for komprimering og dekomprimering av filer ved hjelp av GZip-formatet, inkludert 7-Zip, BetterZip, PKZip, WinZip og WinRAR.
3. BZ / BZ2
BZ ligner på GZ, men bruker Burrows-Wheelers Transform Algorithm, noe som resulterer i litt mer komprimering og mindre filstørrelse. Selv om kompresjonen er treg, er dekompresjonen ganske rask. De fleste av programvaren som støtter GZ støtter også BZ.
4. Zip
Zip er trolig det mest kjente og brukte arkiveringsformatet. Zip bruker deflate-algoritmen og støtter lossless komprimering. Den støtter også AES og DES kryptering. De fleste moderne operativsystemer leveres med innebygd støtte for zip-format, slik at du ikke trenger en egen programvare for arkivering og arkivering av zip-filer.
5. 7Z
7Z arkiveringsformat ble introdusert med et gratis og åpen kildekode-verktøy kalt 7-Zip. Det er det mest avanserte generelle komprimerings- og arkiveringsformatet som støtter de fleste datakomprimerings- og krypteringsalgoritmer, inkludert de som vi har diskutert ovenfor. 7Z-format komprimerer filene mer enn noe annet format, men er relativt langsommere i behandlingen. En annen begrensning er at 7-Zip-programvaren kun er tilgjengelig for Windows. Det er ingen visuell støtte for Mac eller Linux. 7Z støtter også arkivering av flere deler.
6. RAR
RAR er et proprietært arkiveringsformat. Mens det kan leses og hentes ut av andre verktøy som 7-Zip og WinZip, kan det bare opprettes ved hjelp av WinRAR-verktøyet. RAR var det mest populære formatet for arkivering av flere deler før 7Z ble utgitt. Nå kan 7Z gjøre samme oppgave gratis som RAR gjør ved at brukerne betaler for WinRAR-programvaren. RAR støtter AES-kryptering.
Andre komprimerings- og arkiveringsformater
Her er noen av de relativt mindre kjente formatene:
XZ er et tabsfritt datakompresjonsformat som bruker LZMA2 komprimeringsalgoritme. Det kan tenkes som en avkortet versjon av 7Z.
LHA, tidligere kjent som LHarc, brukes primært til komprimering av installasjonsfiler og spill (mest brukt i Japan). Interessant nok kommer den japanske versjonen av Windows 7 med den innebygde støtten til LHA-arkiver.
ACE er et proprietært datakomprimeringsarkivformat som var en konkurrent til RAR-format i begynnelsen av 2000.
StuffIt ble først og fremst utgitt for Mac, men versjoner for Windows, Linux og Solaris ble utgitt etterpå. Dette er et proprietært komprimeringsformat som brukes av StuffIt-verktøy.
Konklusjon
I Linux er det mest brukte formatet gz (eller tar.gz), etterfulgt av bz, mens i Windows eller Mac er det mest brukte formatet Zip. For kompatibilitet på tvers av plattformen er Zip-format den som skal brukes. Hvis du vil ha funksjoner som sikkerhet, høy komprimering og multi-del arkivering, gå til 7Z-format. RAR er lik 7Z, bortsett fra at den kommer med en prislapp. Unngå det så mye som mulig.
Hvilket filformat og verktøy bruker du for komprimering?
Bildetekst: Vår, M-94 Cipher Device Replica