Hvordan fungerer lydkomprimering, og hva er "lossless" lyd?

Bare denne uken begynte Spotify å teste "lossless" lydfiler. Men hva er "lossless" lyd, akkurat, og hvordan fungerer digital lydkomprimering?

Hvordan fungerer lydkomprimering?

Målet med lydkomprimering er å redusere antall biter som kreves for å nøyaktig gjengi en analog lyd. Den første prosessen vi ser på, kalles "lossy." Lossy komprimering er en enveis teknikk som kaster bort ikke-kritiske data for å spare plass. Disse teknikkene er de vanligste metodene som brukes til å komprimere lydfiler, som vises både i MP3, AAC og WMA-filer. Det er to steder som lossy codecs ser ut til å spare biter: bithastighet og psykoakustikk.

Bithastighet

Bitrate måler mengden biter som brukes til å kode et enkelt sekund av lyd. Hvis vi for eksempel bruker 8 kilobitt per sekund (kbps) koding av lav kvalitet, er algoritmen begrenset til å bruke bare 8 kilobitt data for å beskrive hvert sekund av lyd. Det er som å prøve å beskrive et fargefotografi med bare noen få hundre piksler. Du kan få de brede slagene riktig, men generelt ser du på et alvorlig forringet bilde. Hvis vi bruker en høyere bithastighet som 192 kbps, har vi god plass til å dekke nyanserte detaljer. For å gå tilbake til vårt fotografiske eksempel, har vi nå nok piksler til å beskrive de forskjellige lysene, mørkene og fargene i et bilde. En høy bithastighet bestemmer ikke kvaliteten på et opptak selv, men en lav bithastighet kan sterkt begrense utgangskvaliteten.

psykoakustikk

Psykoakustikk er vitenskapen om hvordan hjernen forstår lyder. Ved å manipulere kjente quirks i måten mennesker oppfatter lyd, kan komprimeringsalgoritmer smart fjerne detaljer som de fleste menneskelige ører ikke vil savne. Målet er å "avrunde" informasjon som ikke vil endre den oppfattede lydkvaliteten til et spor, og fjerner kun ubetydelig informasjon.

For eksempel kan du kanskje det typiske spekteret av menneskelig hørsel er mellom 20 Hz og 20 kHz. Tydeligvis kan lyder utenfor dette området fjernes. Videre er det mest detaljerte omfanget av menneskelig hørsel mellom 100Hz og 4kHz, og fjernelse av stille lyder utenfor disse frekvensområdene gjør minimal skade på kvaliteten på et opptak. Vi kan gjøre et lignende triks med svært kontrastfylte lyder. Hvis en svært høy lyd og en veldig lyd spiller samtidig, er den stille lyden mye vanskeligere å oppleve enn det ville være på egenhånd. Kodere utnytter denne "lydmaskeringen" for å fjerne den stille lyden, og sparer biter i prosessen.

Frekvens kan også påvirke hvor godt vi oppfatter lyder. For eksempel har en vedvarende, lavfrekvent trommeslag en tendens til å drukne ut de mer delikate, høyere frekvensene av melodiske instrumenter. Og lydmaskering er spesielt effektiv over 15 kHz, hvor menneskelig hørsel er vanligvis mindre følsom for å begynne med.

Vanlige lydkomprimeringssystemer som MP3 utnytter hele spekteret av komprimeringsmuligheter, samtidig som de forsøker å forbli så trofaste mot det opprinnelige opptaket som mulig. Selvfølgelig føles noen folk som å fjerne disse frekvensene alvorlig skade på opptaket. Det er derfor lossless kompresjonsstandarder.

Hva er "Lossless" lyd?

Forsinket lydkomprimering er målet å redusere filstørrelsen, mens du lar originalt lyd uberørt. Disse kodeker bruker ikke noen av de permanente komprimeringsteknikkene ovenfor, men fokuserer i stedet på fullt reversible datakomprimeringsmetoder. De bruker lossless komprimeringsteknikker lånt fra filkomprimeringsalgoritmer som ZIP for å fjerne overflødige data samtidig som integriteten til den underliggende informasjonen opprettholdes. To populære lossless audio codecs - FLAC og Apple Lossless (ALAC) - begge bruker ordninger basert på ZIP-komprimering.

Fokus på datakomprimering betyr bare å bevare mange av detaljene som MP3 og andre lossy-standarder vil utrydde. Hvis du har skarpe ører og et høyt kvalitets lytteoppsett, kan forskjellen være palpabel.

Lossless komprimering er ikke bare bra for å lytte, men: det er også et flott lagringsverktøy. Akkurat som om du ikke vil ha en 72dpi JPG til å være den eneste digitale kopien av Ansel Adams fotografier, vil vi ikke bare ha 128kbps MP3-filer av typen Blå. Uslettede standarder som FLAC gjør at vi kan lagre lyd effektivt uten å kaste bort potensielt verdifulle data. De gjør også remastering og omfordeling av lyden lettere, siden begynnelsen med kompromissløse mestere betyr et høyere kvalitet ferdig produkt.

Konklusjon: Kan du fortelle forskjellen?

Lossless lydformater gir bedre lydopptak. Men noen ganger er forskjellene mellom en høyverdig MP3 og en lossless fil nesten umerkelig, spesielt for det uopplærte øret. Hvis du vil se om hodetelefonene dine (og ørene) er opptatt nok til å fortelle forskjellen, har NPR en morsom test; bare husk at billige hodetelefoner og bærbare høyttalere ikke vil kunne gjengi de subtile forskjellene mellom lossless lyd og MP3. For en mer seriøs analyse av kodeker, sjekk ut SoundExpert's encoder ratings.