Een introductie in enkele belangrijke compressie
technieken
Vooraf
Er bestaat een zeker misverstand en verwarring rond de inhoud van termen als audio
compressie , audio encoding en audio decoding . In wat volgt geven wij een overzicht over
wat dient verstaan te worden onder deze termen.
Het doel van audiocompressie
In de beginjaren van de stockering van audio op de harde schijf nam deze operatie
een groot deel van ruimte in . Een voorbeeld maakt dit overduidelijk. Veronderstel dat gij
uw favoriete melodie ,duur 1 minuut , wil stockeren. Omdat CD kwaliteit nauwelijks
voldoende goed genoeg is voor U eist u dat de samplesnelheid 44.1 kHz is , u eist voorts
stereo en 16 bits per sampel. Wel dan zit u voor uw opname aan een bitstroom van
44.100*2(stereo)* 2bytes*60sec = 10 MBytes !!!
Als gij dat wil downloaden van het net met een 28.8 modem zal u dat:
10.000.000bytes*8bits/byte/(28800 bits/s*60 s/min) = 49 minuten tijd vergen.
Digitale audio codering ,welke in deze context equivalent is aan audiocompressie , is
de kunst om deze stockagegrootte (kanaalbreedte genaamd) te minimaliseren aan de hand van
vooropgestelde criteria. Zo exploiteren perceptuele audio technieken zoals MPEG
layer-3 compressiefenomenen die op een natuurlijke wijze gebeuren bij het menselijk
horen, better bekend als maskeereffecten . Zo bereikt men een reductie van een factor 10
zonder noemingswaardig verlies aan kwaliteit. Zulke technieken zijn derhalve de
sleutelmethoden voor hoge kwaliteit en lage bit-rate toepassingen in cd-rom spelletjes,
internet audio , digitale zendradio's enz.
De twee onderdelen van audio compressie
Audiocompressie bestaat essentiëel uit twee delen. Het eerste deel ,codering ,
transformeert de digitale audio data bijvoorbeeld gestockeerd in wav-formaat in een zeer
gecomprimeerde form bitstroom genaamd. Om deze daarna af
te spelen langs de geluidskaart moet u deze bitstroom eerst weer decoderen
tot een wav-bestand .Bij de Mu-en A Wet ( zie verder) heten deze onderdelen
respectievelijk compressors en expanders , maar het doel is en blijft hetzelfde,
stockering en transmissie moeten gebeuren met een lage bitstroom ! Deze lage bitstroom
wordt dus altijd verkregen door algoritmen toe te passen op de audio data die de
redundanties en irrelevanties in het frequentiespectrum verwijderen. Deze algoritmen zijn
meestal gebaseerd op een of ander model van het menselijk gehoorapparaat. Na
het mechanisme van codering en decodering te hebben toegepast eindigt men niet meer met de
oorspronkelijke audio data . Alle overbodige informatie is immers uit de data geperst maar
het uiteindelijk wav-bestand zal nagenoeg hetzelfde klinken als de originele.
Om de graad van compressie aan te duiden gebruiken de experten de term bitrate.
Bitrate slaat op het gemiddeld aantal kbites per seconde dat een weergave van de
audio data opeist. Zo is de bit-rate bij audio-cd ongeveer 1411.2 kbps en in MPEG-2
AAC formaat beslaat de bit-rate slechts 96 kbps !!!