compressie

[ Home ] [ hoger ] [ compressieformats ] [ Mu & A Wet ] [ mpeg ] [ lpc ] [ streaming audio ] [ ACM ]

Een introductie in enkele belangrijke compressie technieken

Vooraf

Er bestaat een zeker misverstand en verwarring rond de inhoud van termen als audio compressie , audio encoding en audio decoding . In wat volgt geven wij een overzicht over wat dient verstaan te worden onder deze termen.

Het doel van audiocompressie

In de beginjaren van de stockering van audio op de harde schijf nam deze operatie een groot deel van ruimte in . Een voorbeeld maakt dit overduidelijk. Veronderstel dat gij uw favoriete melodie ,duur 1 minuut , wil stockeren. Omdat CD kwaliteit nauwelijks voldoende goed genoeg is voor U eist u dat de samplesnelheid 44.1 kHz is , u eist voorts stereo en 16 bits per sampel. Wel dan zit u voor uw opname aan een bitstroom van

44.100*2(stereo)* 2bytes*60sec = 10 MBytes !!!

Als gij dat wil downloaden van het net met een 28.8 modem zal u dat:

10.000.000bytes*8bits/byte/(28800 bits/s*60 s/min) = 49 minuten tijd vergen.

Digitale audio codering ,welke in deze context equivalent is aan audiocompressie , is de kunst om deze stockagegrootte (kanaalbreedte genaamd) te minimaliseren aan de hand van vooropgestelde criteria. Zo exploiteren perceptuele audio technieken zoals MPEG layer-3 compressiefenomenen die op een natuurlijke wijze gebeuren bij het menselijk horen, better bekend als maskeereffecten . Zo bereikt men een reductie van een factor 10 zonder noemingswaardig verlies aan kwaliteit. Zulke technieken zijn derhalve de sleutelmethoden voor hoge kwaliteit en lage bit-rate toepassingen in cd-rom spelletjes, internet audio , digitale zendradio's enz.

De twee onderdelen van audio compressie

Audiocompressie bestaat essentiëel uit twee delen. Het eerste deel ,codering , transformeert de digitale audio data bijvoorbeeld gestockeerd in wav-formaat in een zeer gecomprimeerde form bitstroom genaamd. Om deze daarna af te spelen langs de geluidskaart moet u deze bitstroom eerst weer decoderen tot een wav-bestand .Bij de Mu-en A Wet ( zie verder) heten deze onderdelen respectievelijk compressors en expanders , maar het doel is en blijft hetzelfde, stockering en transmissie moeten gebeuren met een lage bitstroom ! Deze lage bitstroom wordt dus altijd verkregen door algoritmen toe te passen op de audio data die de redundanties en irrelevanties in het frequentiespectrum verwijderen. Deze algoritmen zijn meestal gebaseerd op een of ander model van het menselijk gehoorapparaat. Na het mechanisme van codering en decodering te hebben toegepast eindigt men niet meer met de oorspronkelijke audio data . Alle overbodige informatie is immers uit de data geperst maar het uiteindelijk wav-bestand zal nagenoeg hetzelfde klinken als de originele.

Om de graad van compressie aan te duiden gebruiken de experten de term bitrate. Bitrate slaat op het gemiddeld aantal kbites per seconde dat een weergave van de audio data opeist. Zo is de bit-rate bij audio-cd ongeveer 1411.2 kbps en in MPEG-2 AAC formaat beslaat de bit-rate slechts 96 kbps !!!

Hoe werkt een compressie sessie in het algemeen

Alle coderingsalgoritmen werken op dezelfde manier. De coderingsschema's kunnen gekarakteriseerd worden als " perceptieve geluid vormgeving " of " perceptieve subband transformatie codering" . Het codeeralgoritme analyseert de spectrale componenten van de audio opname door een filterbank toe te passen op het signaal. Daarna past het een psycho-akoestisch model toe om de juist hoorbare niveau's te schatten . In de quantisatiefase probeert de encoder dan een juist aantal bits toe te kennen aan gedeelten van het signaal om zowel aan de eisen van de gemiddelde bit-rate als aan eisen van de maskeereffecten te voldoen. Zo gebeurt het bij lpc en mpeg en in een meer rudimentaire vorm bij de mu-en A wet compressie methoden.

gewijzigd op 21/09/00

auteurs: Raoul Meuldermans

reviewer :