
Comparativa tra compressori audio - MP3, OGG e WMA in prova
Pubblicato il 20/1/2005 10:00:00 | Sezione Audio
|
Guida ai formati di compressione audio - MP3, WMA ed OGG
Introduzione UpYou.it inaugura il nuovo anno con una guida dedicata a tutti gli appassionati di musica che adorano ascoltare i propri titoli preferiti sul computer ma anche sui vari dispositivi portatili oggi disponibili. Per questo abbiamo pensato ad un articolo dove riassumere, attraverso prove oggettive ed impressioni personali, le caratteristiche dei più comuni formati di compressione audio digitale, tra cui ovviamente non possono mancare i formati MP3, WMA ed OGG. Buona lettura!!
Nota: Alcuni termini utilizzati nell'articolo ( quelli con l'asterisco ) sono strettamente tecnici. Abbiamo quindi organizzato una pagina conclusiva contenente anche un piccolo glossario per i "profani".
Il software utilizzato Data la diffusione sempre più ampia dei nuovi dispositivi portatili per la riproduzione di file musicali abbiamo pensato che fosse utile eseguire dei test per verificare quale fra i vari formati di compressione audio disponibile e gratuiti permettesse di ottenere il miglior rapporto tra qualità e compressione. Per effettuare queste prove abbiamo utilizzato GoldWave, un software in grado di rilevare la risposta in frequenza di un particolare segnale ( nel nostro caso un flusso audio digitale ) ma anche di estrarre e riprodurre file audio in molteplici formati. Tra i vari Codec più o meno utilizzati abbiamo selezionato quelli più diffusi e famosi:
- MP3 LAME ( gratuito ) - OGG Vorbis ( gratuito ) - WMA 8 e 9 ( gratuito ) - MP3 FRAUNHOFER ( gratuito ) - MP3 FRAUNHOFER Professional ( a pagamento )
Come potete vedere abbiamo scelto tra i vari codec grauiti MP3 disponibili il Lame che è risultato nelle nostre prove decisamente il migliore rispetto agli altri dello stesso formato compreso il FRAUNHOFER nella sua versione non Professional. Alcuni svantaggi della versione PRO sono invece, a parte il costo, la mancanza delle modalità ABR e VBR e una risposta in frequenza che risente troppo se si attiva l'opzione Stereo invece di Joint Stereo (*).
Ma passiamo ai fatti concreti...
Le prove
Per i confronti abbiamo usato delle tracce audio prelevate da cd originali estratte in formato Wave. Sono state usate una traccia di genere moderno, con escursioni di frequenze molto varie, e una seconda traccia di genere classico, per la precisione “Vivaldi” con la sua “Primavera”. Oltre a queste abbiamo aggiunto anche una traccia di rumore bianco (*) della durata di 20 secondi prelevata da un cd audio test.
NOTA BENE: teniamo a precisare che le prove che seguono sono solo OGGETTIVE, infatti, non avendo un udito esoterico non abbiamo voluto dare giudizi sulla qualità dei risultati, ma solo ciò che appariva sugli strumenti che avevamo a disposizione.
Vediamo i risultati. Parlando dei files musicali, lo spettrogramma del LAME è sempre risultato più “alto” di quello degli altri compressori, compreso il WMA versione 9 a 128Kbit/s CBR (*) che però raggiunge dimensioni molto superiori. I parametri utilizzati con il codec LAME sono i seguenti: -b 32 -m f -h -abr 64 -B 96 -resample 44.1 -k
Nel caso del rumore bianco i risultati sono stati deludenti con tutti i compressori loss provati; infatti essi hanno tagliato inesorabilmente le frequenze al di sopra di un certo limite. Unica eccezione a questo massacro è stato il WMA Professional lossless che però produceva un file piuttosto grande e che spesso risulta non compatibile con i lettori portatili. Un'altra sorpresa deriva dal codec LAME che in modalità ABR centrata a 64Kbit/s è migliore del WMA 64Kbit/s CBR. Infatti, lo spettro sul rumore bianco è quasi completo, solo un po’ “farinoso” e con molti "buchi". L’Ogg Vorbis sempre a 64Kbit/s è stato migliore del WMA a pari bitrate ma il file prodotto però non è risultato tanto più compresso, quindi sembra preferibile il LAME ABR(*).
Per sfizio abbiamo provato anche il WMA 9 Professional VBR con fattore Q settato a 50 e a 98. Il WMA 9 con Q a 50 è appena migliore del WMA 8 a 64Kbit CBR mentre quello con Q a 98 è decisamente ottimo solo che le dimensioni del file sono risultate astronomiche!
Traccia 1 - Musica Moderna
| Codec | Dimensione File | Risposta Strumentale | | WAV | 39.344 Kb |     | | WMA Professional lossless | 26.462 Kb |     | | WMA 9 VBR Q98 | 10.550 Kb |    | | LAME ABR 64 (min 32 max 96) res. 44.1 | 1.939 Kb |    | | Ogg Vorbis 64 | 1.925 Kb |    | | WMA 9 VBR Q50 | 2.750 Kb |   | | WMA 8 64Kbit/s CBR | 1.810 Kb |   |
Ricordiamo che questi risultati sono estrapolati da una visualizzazione delle forme d’onda e degli spettrogrammi ottenuti da GoldWave.
Traccia 2 - Rumore Bianco
| Codec | Parametri | Dimensione File | Risposta Apparente | | WAV | file non compresso | 1.723 Kb |      | | OGG vorbis | CBR, q7 | 206 Kb |      | | WMA8 | CBR, 128Kbit/s | 184 Kb |     | | WMA8 | CBR, 96Kbit/s | 139 Kb |      | | WMA9 | VBR, Q75 | 113 Kb |      | | WMA9=WMA8 | CBR, 64Kbit/s | 94 Kb |     | | LAME | ABR, 64-96-128 res. 44.1 | 83 Kb |       | | OGG vorbis | CBR, q0 | 76 Kb |     | | OGG vorbis | ABR, min 32 max 96 | 76 Kb |     | | WMA9 | VBR, q50 | 73 Kb |    | | LAME | ABR, 48-64-128 res. 44.1 | 60 Kb |       | | LAME | ABR, 32-64-96 resample 44.1 | 59 Kb |       | | LAME | ABR, 32-64-96 noresample | 55 Kb |      |
Per risposta strumentale si intende il valore massimo raggiunto dall’analizzatore di spettro e dallo spettrogramma di GOLDwave. 15 stelle corrispondono alla estensione massima mentre le stelle indicano una escursione “evanescente”, più frammentata rispetto alla stella , in altre parole 15 stelle gialle indicano una risposta completa mentre 13 stelle gialle con 2 stelle viola indicano un' estensione completa ma più frammentata.
Spettrogrammi
NOTA BENE: Per dare un'informazione più accurata ai nostri lettori abbiamo pensato di fornire nell'articolo gli screenshots tratti dallo spettrogramma di GoldWave delle due traccie test di Rumore Rosa e Rumore Bianco compresso nei vari formati: in questo modo potete valutare la validità delle affermazioni. Di seguito trovate le anteprime rimpicciolite di tali immagini. Cliccatele per visualizzare l'immagine ingrandita.
 | Rumore Bianco - Fraunhofer -128kbps CBR |
|  | Rumore Bianco - Fraunhofer -256kbps CBR |
|
 | Rumore Bianco - LAME -128kbpd CBR |
|  | Rumore Bianco - MP3 no LAME - 128kbps CBR |
|
 | Rumore Bianco-OGG 128Kbps -Q04 |
|  | Rumore Bianco-OGG 192Kbps -Q06 |
|
 | Rumore Bianco - WMA - 128Kbps |
|  | Rumore Bianco - WMA - 64Kbps |
|
 | Rumore Bianco - WMA-96Kbps - q100 |
|  | Rumore Bianco - WMA - lossless q100 |
|
 | Rumore Bianco - WMA PRO 24 bit 128kbps |
|  | Rumore Bianco - WMA VBR-Q75 |
|
 | Rumore Bianco WMA-VBR-Q98 |
|  | Rumore Rosa - LAME-128Kbps CBR |
|
 | Rumore Rosa MP3 No LAME -128kbps CBR |
|  | Rumore Rosa OGG 128kbps |
|
 | Rumore Rosa WMA-128Kbps |
|  | Rumore Rosa WMA-64kbps |
|
 | Rumore Bianco WAV |
|  | Rumore Rosa WAV |
|
Prove di Ascolto
NOTA BENE: Le prove che seguono sono state eseguite sempre utilizzando l'analizzatore di spettro di GoldWave ma abbiamo pensato di aggiungere anche una breve descrizione delle "sensazioni" derivate dall'ascolta delle varie traccie compresse secondo i vari codec. Tali valutazioni sono da considerarsi soggettive e possono variare da persona a persona.
Prove di ascolto - Traccia 1 - Musica Moderna
| Codec | Parametri | Dimensione File | Risposta Apparente | | Sensazione | | WAV | file non compresso | 39.250 Kb |      | OTTIMA | | OGG vorbis | CBR, q7 | 5.972 Kb |      | OTTIMA | | WMA8 | CBR, 128Kbit/s | 3.598 Kb |      | Quasi ottima | | WMA8 | CBR, 96Kbit/s | 2.704 Kb |      | Buona | | WMA9 | VBR, Q75 | 3.937 Kb |     | Buona ma un pò ovattata | | WMA9=WMA8 | CBR, 64Kbit/s | 3.937 Kb |     | Scarsi acuti (ovattata) | | LAME | ABR, 64-96-128 res. 44.1 | 2.728 Kb |       | Buona | | OGG vorbis | ABR, min 32 max 96 | 1.600 Kb |     | Buona | | WMA9 | VBR, q50 | 2.530 Kb |      | Sufficiente ma metallica | | LAME | ABR, 32-64-96 res. 44.1 | 1.902 Kb |     | Metallica ma sufficiente |
Prove di ascolto - Traccia 2 - "Primavera" di Vivaldi
| Codec | Parametri | Dimensione File | Risposta Apparente | Sensazione | | WAV | file non compresso | 31.087 Kb |      | OTTIMA | | OGG vorbis | CBR, q7 | 4.895 Kb |      | molto simile al WAVE | | WMA8 | CBR, 128Kbit/s | 2.851 Kb |      | abbastanza buona | | WMA8 | CBR, 96Kbit/s | 2.143 Kb |     | pochi acuti | | WMA9 | VBR, Q75 | 1.915 Kb |     | sensazione di chiusura | | WMA9=WMA8 | CBR, 64Kbit/s | 1.437 Kb |     | suono molto chiuso | | LAME | ABR, 64-96-128 res. 44.1 | 1.934 Kb |      | suono decente brillante | | OGG vorbis | ABR, min 32 max 96 | 1.256 Kb |      | suono abbastanza buono | | WMA9 | VBR, q50 | 1.212 Kb |      | suono piuttosto chiuso | | LAME | ABR, 32-64-96 res. 44.1 | boh |       | suono un po’ stridente, sufficiente |
Qualche commento anche a queste tabelle. Osservando i risultati nella risposta strumentale n particolare possiamo notare come il LAME ABR con resample a 44.1 riesca a coprire una buona parte dello spettro audio anche se in maniera “farinosa”. Ecco il perchè della valutazione soggettica di ascolto per verificare per bene le caratteristichecuratissima. Tali prove soggettive evidenziano la qualità dell' Ogg Vorbis Q7 che però comprime poco. Un buon compromesso sembra il LAME in modalità ABR centrata a 96Kbit/s o Ogg vorbis ABR min 32 MAX 96. Per il resto delude WMA9 a bassi bitrate poiché TAGLIA moltissime alte frequenze.
Massima Qualità
Come ultimo test abbiamo voluto provare, per ogni compressore, il massimo della qualità ottenibile con i migliori parametri in assoluto. Naturalmente in questo caso una prova soggettiva non avrebbe potuto rendere le differenze abbastanza macroscopiche da poter essere rilevate.
Abbiamo utilizzato un brano Disco molto ricco di armoniche ed inoltre una traccia di rumore BIANCO più un suono full range ( che copre l'intera banda udibile ) sinuosoidale, giusto per andare in fondo . Di seguito trovate un breve commento che riassume i risultati ottenuti.
Il WMA 8 a 192Kb/s ( il massimo bitrate per questo codec ) purtroppo taglia le alte frequenze oltre i 18.000 Hertz mentre il FRAUNHOFER Professional a 320 Kb/s è sicuramente il peggiore; le alte frequenze sono “bucate”, si nota della distorsione in modalità STEREO. In modalità Joint Stereo (*) è sicuramente ottimo. Passando al LAME settato a 320 Kb/s abbiamo ottenuto un risultato ottimo con un segnale molto pulito. Sempre il LAME in VBR 320 Kb/s risulta ancora validissimo e le differenze sono irrilevanti. OGG VORBIS con q=10 èsemplicemente spettacolare, veramente buono ma anche a q=9.1 ( 320Kb/s ) si dimostra ottimo e sembra speculare al WAV. Il FASTENC in VBR q=91 ma anche q=100 purtroppo taglia inesorabilmente le alte frequenza sopra a 16.000 Hertz risultando peggiore del WMA 8.
Siamo giunti alla fine dell'articolo. Per chi di vopi che non avesse capito un concetto o che tra tante sigle si è un po' perso riserviamo una pagina di glossario.
Glossario
Ecco la sezione che abbiamo nominato all'inizio in cui riassumiamo le definizioni ed i concetti fondamentali per comprendere pienamente l'articolo.
Risposta in Frequenza: Con tale termine si intende di solito la capacità di un qualunque strumento sonoro a riprodurre "fedelmente" la banda udibile. Ottimisticamente il nostro apparato uditivo dovrebbe coprire la banda che parte dai 20 Hertz e finisce a 20.000 Hertz. Nella realtà generalmente il nostro udito presenta delle imperfezioni sia come estensione che come linearità. La linearità di risposta significa solo che a parità di segnale (o pressione acustica) il livello di suono misurato rimane costante.
Joint Stereo: La funzione Joint stereo permette di comprimere i segnali audio con maggiore efficienza a scapito di un piccolo degrado dell'informazione spaziale (teorica). Il joint stereo consiste nell' utilizzare una sola traccia memorizzando a parte "solo" le eventuali differenze dei due canali. In questo modo al momento della decompressione il segnale verrà ricostruito partendo dall'informazione monofonica a cui andranno aggiunte le differenze memorizzate, per poter poi "ricostruire" l'immagine stereo. In questo modo si ottiene una maggiore compressione e in tutti i codec MP3 che provati anche una maggiore risposta in frequenza.
CBR: CBR significa Costant BitRate e indica cioè che il campionamento del suono avviene a memorizzando le informazioni con una quantità di bit costante per ogni campione.
VBR: VBR significa Variable BitRate e al contrario del primo significa che il suono viene campionato utilizzando un numero di bit variabile a seconda della complessità dello stesso. La funzione VBR prevede l'inserimento di più parametri rispetto al CBR, infatti bisogna specificare il BitRate minimo e quello massimo; il codec provvederà a stabilire il bitrate a seconda della complessità del brano da comprimere. A differenza del sistema CBR il VBR spesso risulta di migliore qualità senza subire grandi modifiche nelle dimensioni.
ABR: ABR è simile al VBR solo che cerca di mantenere il bitrate ad un valore medio fra il minimo e massimo specificati. Il file audio risulta spesso più compatto che con VBR.
NOTA: non tutti i compressori audio permettono la scelta tra queste varie modalità!
Rumore Bianco: Il rumore bianco è un particolare tipo di onda sonora che ha come caratteristica quella di avere una risposta in frequenza costante per tutta la banda audio. Tale onda è sempre stata molto utilizzata nei test poichè permette con relativa efficacia di verificare gravi lacune nella risposta in frequenza di qualunque apparato sonoro.
Rumore Rosa: Il rumore rosa differisce da quello bianco per un andamento della frequenza, diciamo "semplicisticamente", più votato alle basse frequenze.
|
|