Comparativa tra compressori audio - MP3, OGG e WMA in prova

Pubblicato il 20/1/2005 10:00:00 | Sezione Audio

Guida ai formati di compressione audio - MP3, WMA ed OGG



Introduzione
UpYou.it inaugura il nuovo anno con una guida dedicata a tutti gli appassionati di musica che adorano ascoltare i propri titoli preferiti sul computer ma anche sui vari dispositivi portatili oggi disponibili. Per questo abbiamo pensato ad un articolo dove riassumere, attraverso prove oggettive ed impressioni personali, le caratteristiche dei più comuni formati di compressione audio digitale, tra cui ovviamente non possono mancare i formati MP3, WMA ed OGG.
Buona lettura!!

Nota: Alcuni termini utilizzati nell'articolo ( quelli con l'asterisco ) sono strettamente tecnici. Abbiamo quindi organizzato una pagina conclusiva contenente anche un piccolo glossario per i "profani".

Il software utilizzato
Data la diffusione sempre più ampia dei nuovi dispositivi portatili per la riproduzione di file musicali abbiamo pensato che fosse utile eseguire dei test per verificare quale fra i vari formati di compressione audio disponibile e gratuiti permettesse di ottenere il miglior rapporto tra qualità e compressione. Per effettuare queste prove abbiamo utilizzato GoldWave, un software in grado di rilevare la risposta in frequenza di un particolare segnale ( nel nostro caso un flusso audio digitale ) ma anche di estrarre e riprodurre file audio in molteplici formati. Tra i vari Codec più o meno utilizzati abbiamo selezionato quelli più diffusi e famosi:

- MP3 LAME ( gratuito )
- OGG Vorbis ( gratuito )
- WMA 8 e 9 ( gratuito )
- MP3 FRAUNHOFER ( gratuito )
- MP3 FRAUNHOFER Professional ( a pagamento )

Come potete vedere abbiamo scelto tra i vari codec grauiti MP3 disponibili il Lame che è risultato nelle nostre prove decisamente il migliore rispetto agli altri dello stesso formato compreso il FRAUNHOFER nella sua versione non Professional. Alcuni svantaggi della versione PRO sono invece, a parte il costo, la mancanza delle modalità ABR e VBR e una risposta in frequenza che risente troppo se si attiva l'opzione Stereo invece di Joint Stereo (*).

Ma passiamo ai fatti concreti...


Le prove

Per i confronti abbiamo usato delle tracce audio prelevate da cd originali estratte in formato Wave. Sono state usate una traccia di genere moderno, con escursioni di frequenze molto varie, e una seconda traccia di genere classico, per la precisione “Vivaldi” con la sua “Primavera”. Oltre a queste abbiamo aggiunto anche una traccia di rumore bianco (*) della durata di 20 secondi prelevata da un cd audio test.

NOTA BENE: teniamo a precisare che le prove che seguono sono solo OGGETTIVE, infatti, non avendo un udito esoterico non abbiamo voluto dare giudizi sulla qualità dei risultati, ma solo ciò che appariva sugli strumenti che avevamo a disposizione.

Vediamo i risultati. Parlando dei files musicali, lo spettrogramma del LAME è sempre risultato più “alto” di quello degli altri compressori, compreso il WMA versione 9 a 128Kbit/s CBR (*) che però raggiunge dimensioni molto superiori. I parametri utilizzati con il codec LAME sono i seguenti: -b 32 -m f -h -abr 64 -B 96 -resample 44.1 -k

Nel caso del rumore bianco i risultati sono stati deludenti con tutti i compressori loss provati; infatti essi hanno tagliato inesorabilmente le frequenze al di sopra di un certo limite.
Unica eccezione a questo massacro è stato il WMA Professional lossless che però produceva un file piuttosto grande e che spesso risulta non compatibile con i lettori portatili.
Un'altra sorpresa deriva dal codec LAME che in modalità ABR centrata a 64Kbit/s è migliore del WMA 64Kbit/s CBR. Infatti, lo spettro sul rumore bianco è quasi completo, solo un po’ “farinoso” e con molti "buchi". L’Ogg Vorbis sempre a 64Kbit/s è stato migliore del WMA a pari bitrate ma il file prodotto però non è risultato tanto più compresso, quindi sembra preferibile il LAME ABR(*).

Per sfizio abbiamo provato anche il WMA 9 Professional VBR con fattore Q settato a 50 e a 98. Il WMA 9 con Q a 50 è appena migliore del WMA 8 a 64Kbit CBR mentre quello con Q a 98 è decisamente ottimo solo che le dimensioni del file sono risultate astronomiche!

Traccia 1 - Musica Moderna

CodecDimensione FileRisposta Strumentale
WAV39.344 Kb
WMA Professional lossless26.462 Kb
WMA 9 VBR Q9810.550 Kb
LAME ABR 64 (min 32 max 96) res. 44.11.939 Kb
Ogg Vorbis 641.925 Kb
WMA 9 VBR Q502.750 Kb
WMA 8 64Kbit/s CBR1.810 Kb


Ricordiamo che questi risultati sono estrapolati da una visualizzazione delle forme d’onda e degli spettrogrammi ottenuti da GoldWave.

Traccia 2 - Rumore Bianco

CodecParametriDimensione FileRisposta Apparente
WAVfile non compresso1.723 Kb
OGG vorbisCBR, q7206 Kb
WMA8CBR, 128Kbit/s184 Kb
WMA8CBR, 96Kbit/s139 Kb
WMA9VBR, Q75113 Kb
WMA9=WMA8CBR, 64Kbit/s94 Kb
LAMEABR, 64-96-128 res. 44.183 Kb
OGG vorbisCBR, q076 Kb
OGG vorbisABR, min 32 max 9676 Kb
WMA9VBR, q5073 Kb
LAMEABR, 48-64-128 res. 44.160 Kb
LAMEABR, 32-64-96 resample 44.159 Kb
LAMEABR, 32-64-96 noresample55 Kb


Per risposta strumentale si intende il valore massimo raggiunto dall’analizzatore di spettro e dallo spettrogramma di GOLDwave. 15 stelle corrispondono alla estensione massima mentre le stelle indicano una escursione “evanescente”, più frammentata rispetto alla stella , in altre parole 15 stelle gialle indicano una risposta completa mentre 13 stelle gialle con 2 stelle viola indicano un' estensione completa ma più frammentata.


Spettrogrammi

NOTA BENE: Per dare un'informazione più accurata ai nostri lettori abbiamo pensato di fornire nell'articolo gli screenshots tratti dallo spettrogramma di GoldWave delle due traccie test di Rumore Rosa e Rumore Bianco compresso nei vari formati: in questo modo potete valutare la validità delle affermazioni. Di seguito trovate le anteprime rimpicciolite di tali immagini. Cliccatele per visualizzare l'immagine ingrandita.

Rumore Bianco - Fraunhofer -128kbps CBR

Rumore Bianco - Fraunhofer -256kbps CBR



Rumore Bianco - LAME -128kbpd CBR

Rumore Bianco - MP3 no LAME - 128kbps CBR



Rumore Bianco-OGG 128Kbps -Q04

Rumore Bianco-OGG 192Kbps -Q06



Rumore Bianco - WMA - 128Kbps

Rumore Bianco - WMA - 64Kbps



Rumore Bianco - WMA-96Kbps - q100

Rumore Bianco - WMA - lossless q100



Rumore Bianco - WMA PRO 24 bit 128kbps

Rumore Bianco - WMA VBR-Q75



Rumore Bianco WMA-VBR-Q98

Rumore Rosa - LAME-128Kbps CBR




Rumore Rosa MP3 No LAME -128kbps CBR

Rumore Rosa OGG 128kbps



Rumore Rosa WMA-128Kbps

Rumore Rosa WMA-64kbps



Rumore Bianco WAV

Rumore Rosa WAV






Prove di Ascolto

NOTA BENE: Le prove che seguono sono state eseguite sempre utilizzando l'analizzatore di spettro di GoldWave ma abbiamo pensato di aggiungere anche una breve descrizione delle "sensazioni" derivate dall'ascolta delle varie traccie compresse secondo i vari codec. Tali valutazioni sono da considerarsi soggettive e possono variare da persona a persona.

Prove di ascolto - Traccia 1 - Musica Moderna

CodecParametriDimensione FileRisposta ApparenteSensazione
WAVfile non compresso39.250 KbOTTIMA
OGG vorbisCBR, q7 5.972 KbOTTIMA
WMA8CBR, 128Kbit/s 3.598 KbQuasi ottima
WMA8CBR, 96Kbit/s2.704 KbBuona
WMA9VBR, Q75 3.937 KbBuona ma un pò ovattata
WMA9=WMA8CBR, 64Kbit/s 3.937 KbScarsi acuti (ovattata)
LAMEABR, 64-96-128 res. 44.12.728 KbBuona
OGG vorbisABR, min 32 max 961.600 KbBuona
WMA9VBR, q502.530 KbSufficiente ma metallica
LAMEABR, 32-64-96 res. 44.1 1.902 KbMetallica ma sufficiente


Prove di ascolto - Traccia 2 - "Primavera" di Vivaldi

CodecParametriDimensione FileRisposta ApparenteSensazione
WAVfile non compresso31.087 KbOTTIMA
OGG vorbisCBR, q7 4.895 Kbmolto simile al WAVE
WMA8CBR, 128Kbit/s 2.851 Kbabbastanza buona
WMA8CBR, 96Kbit/s2.143 Kbpochi acuti
WMA9VBR, Q75 1.915 Kbsensazione di chiusura
WMA9=WMA8CBR, 64Kbit/s 1.437 Kbsuono molto chiuso
LAMEABR, 64-96-128 res. 44.11.934 Kbsuono decente brillante
OGG vorbisABR, min 32 max 961.256 Kbsuono abbastanza buono
WMA9VBR, q501.212 Kbsuono piuttosto chiuso
LAMEABR, 32-64-96 res. 44.1bohsuono un po’ stridente, sufficiente


Qualche commento anche a queste tabelle. Osservando i risultati nella risposta strumentale n particolare possiamo notare come il LAME ABR con resample a 44.1 riesca a coprire una buona parte dello spettro audio anche se in maniera “farinosa”. Ecco il perchè della valutazione soggettica di ascolto per verificare per bene le caratteristichecuratissima. Tali prove soggettive evidenziano la qualità dell' Ogg Vorbis Q7 che però comprime poco. Un buon compromesso sembra il LAME in modalità ABR centrata a 96Kbit/s o Ogg vorbis ABR min 32 MAX 96. Per il resto delude WMA9 a bassi bitrate poiché TAGLIA moltissime alte frequenze.

Massima Qualità

Come ultimo test abbiamo voluto provare, per ogni compressore, il massimo della qualità ottenibile con i migliori parametri in assoluto. Naturalmente in questo caso una prova soggettiva non avrebbe potuto rendere le differenze abbastanza macroscopiche da poter essere rilevate.

Abbiamo utilizzato un brano Disco molto ricco di armoniche ed inoltre una traccia di rumore BIANCO più un suono full range ( che copre l'intera banda udibile ) sinuosoidale, giusto per andare in fondo . Di seguito trovate un breve commento che riassume i risultati ottenuti.

Il WMA 8 a 192Kb/s ( il massimo bitrate per questo codec ) purtroppo taglia le alte frequenze oltre i 18.000 Hertz mentre il FRAUNHOFER Professional a 320 Kb/s è sicuramente il peggiore; le alte frequenze sono “bucate”, si nota della distorsione in modalità STEREO. In modalità Joint Stereo (*) è sicuramente ottimo.
Passando al LAME settato a 320 Kb/s abbiamo ottenuto un risultato ottimo con un segnale molto pulito. Sempre il LAME in VBR 320 Kb/s risulta ancora validissimo e le differenze sono irrilevanti.
OGG VORBIS con q=10 èsemplicemente spettacolare, veramente buono ma anche a q=9.1 ( 320Kb/s ) si dimostra ottimo e sembra speculare al WAV.
Il FASTENC in VBR q=91 ma anche q=100 purtroppo taglia inesorabilmente le alte frequenza sopra a 16.000 Hertz risultando peggiore del WMA 8.

Siamo giunti alla fine dell'articolo. Per chi di vopi che non avesse capito un concetto o che tra tante sigle si è un po' perso riserviamo una pagina di glossario.



Glossario

Ecco la sezione che abbiamo nominato all'inizio in cui riassumiamo le definizioni ed i concetti fondamentali per comprendere pienamente l'articolo.

Risposta in Frequenza: Con tale termine si intende di solito la capacità di un qualunque strumento sonoro a riprodurre "fedelmente" la banda udibile. Ottimisticamente il nostro apparato uditivo dovrebbe coprire la banda che parte dai 20 Hertz e finisce a 20.000 Hertz. Nella realtà generalmente il nostro udito presenta delle imperfezioni sia come estensione che come linearità.
La linearità di risposta significa solo che a parità di segnale (o pressione acustica) il livello di suono misurato rimane costante.

Joint Stereo: La funzione Joint stereo permette di comprimere i segnali audio con maggiore efficienza a scapito di un piccolo degrado dell'informazione spaziale (teorica). Il joint stereo consiste nell' utilizzare una sola traccia memorizzando a parte "solo" le eventuali differenze dei due canali. In questo modo al momento della decompressione il segnale verrà ricostruito partendo dall'informazione monofonica a cui andranno aggiunte le differenze memorizzate, per poter poi "ricostruire" l'immagine stereo. In questo modo si ottiene una maggiore compressione e in tutti i codec MP3 che provati anche una maggiore risposta in frequenza.

CBR: CBR significa Costant BitRate e indica cioè che il campionamento del suono avviene a memorizzando le informazioni con una quantità di bit costante per ogni campione.

VBR: VBR significa Variable BitRate e al contrario del primo significa che il suono viene campionato utilizzando un numero di bit variabile a seconda della complessità dello stesso.
La funzione VBR prevede l'inserimento di più parametri rispetto al CBR, infatti bisogna specificare il BitRate minimo e quello massimo; il codec provvederà a stabilire il bitrate a seconda della complessità del brano da comprimere. A differenza del sistema CBR il VBR spesso risulta di migliore qualità senza subire grandi modifiche nelle dimensioni.

ABR: ABR è simile al VBR solo che cerca di mantenere il bitrate ad un valore medio fra il minimo e massimo specificati. Il file audio risulta spesso più compatto che con VBR.

NOTA: non tutti i compressori audio permettono la scelta tra queste varie modalità!

Rumore Bianco: Il rumore bianco è un particolare tipo di onda sonora che ha come caratteristica quella di avere una risposta in frequenza costante per tutta la banda audio. Tale onda è sempre stata molto utilizzata nei test poichè permette con relativa efficacia di verificare gravi lacune nella risposta in frequenza di qualunque apparato sonoro.

Rumore Rosa: Il rumore rosa differisce da quello bianco per un andamento della frequenza, diciamo "semplicisticamente", più votato alle basse frequenze.




Questo articolo viene da UpYou
http://www.upyou.it

L'indirizzo di questo articolo è:
http://www.upyou.it/modules/sections/articles.php?artid=8