2
1.1 Obiettivi
Per poter valutare l’influenza del ricampionamento sulla qualità audio percepita, verranno effettuati
alcuni test, proprio tramite PEAQ. Saranno selezionate diverse frequenze di campionamento, e
tipologie di segnali. Attraverso questi confronti ci proponiamo di studiare il ricampionamento e
contribuire al miglioramento della valutazione della qualità audio percepita sotto diversi aspetti.
1.1.1 Ricerca del ricampionatore migliore
I test riguarderanno 3 diversi ricampionatori. Uno degli scopi sarà anche scoprire quale dei 3 si
comporti meglio, provocando una perdita minore rispetto alla qualità audio percepita. Se emergerà
un ricampionatore con valori migliori, ne verrà consigliato l’utilizzo per i futuri test sulla qualità
audio.
Andremo a verificare inoltre se il ricampionatore con i risultati mediamente migliori conferma
l’andamento alle varie frequenze e sui vari tipi di test. Analizzeremo nello specifico i risultati
ottenuti alla frequenza che più ci interessa, 44100Hz. La maggior parte dei segnali originali
utilizzati per i confronti sui formati compressi, infatti, provengono da Cd-Audio, e il
ricampionamento che precede la fase di test parte proprio da tale frequenza.
1.1.2 Influenza sulla valutazione della qualità audio percepita
Sarà importante capire quanto influisce l’eventuale ricampionamento sui test oggettivi conformi alla
ITU-R BS.1387[1]. I confronti saranno effettuati a diverse frequenze di campionamento, su
tipologie di file diverse per cercare di capire qual è l’influenza del ricampionamento e come varia a
seconda dei parametri. In particolare cercheremo di capire se le variazioni sono tali da
compromettere in parte i dati ottenuti da altri test sulla qualità audio, o se magari sono tanto piccole
da poter essere ignorate.
1.1.3 Influenza delle frequenze di ricampionamento
I test coinvolgeranno diverse frequenze di campionamento, osservando la loro influenza sulla
qualità audio. Siccome abbassando il tasso di campionamento si perdono alcune informazioni
frequenziali, ci aspettiamo che, a basse frequenze di campionamento, la riduzione della qualità
audio percepita sia maggiore rispetto alle frequenze più alte. Ci aspettiamo che questo avvenga nei
test sui segnali naturali. Sui segnali sintetici, a banda limitata i risultati potrebbero essere diversi.
Ci attendiamo poi maggiori difficoltà ad alcune frequenze, in rapporto numerico complesso con la
frequenza di test (48000Hz): le frequenze di 44100, 22050 e 11025Hz. Per tutte gli altri tassi di
campionamento che andremo a considerare, il rapporto con i 48000Hz è molto più semplice;
vedremo se questo influisce o meno sulla qualità audio percepita.
1.1.4 Validare il funzionamento del PEAQ con algoritmi di ricampionamento
Gli studi analizzati che utilizzano il confronto PEAQ sono per lo più dedicati alla verifica della
qualità audio nella compressione di segnali. Questo elaborato si propone di verificare se questo tipo
di analisi si può adattare alla valutazione del ricampionamento. Come vedremo, infatti, lo strumento
sviluppato dall’università McGill non è perfetto, e potrebbe rivelarsi inadatto a tale test.
3
1.2 Struttura
Il lavoro di ricerca è suddiviso in 3 parti fondamentali: le basi teoriche, la definizione degli
esperimenti da svolgere e infine i risultati ottenuti e le conclusioni.
La parte teorica è affrontata nel secondo capitolo, che tratta il ricampionamento e la valutazione
della qualità audio percepita. Esamineremo i metodi utilizzati per modificare la frequenza di
campionamento, il loro funzionamento le limitazioni che comportano. Per la qualità audio, vedremo
il funzionamento dei test oggettivi proposti dall’ITU-R BS.1387[1], e sceglieremo quali variabili
utilizzare per l’analisi dei risultati. Daremo uno sguardo anche ai test soggettivi, come definiti
nell’ITU 1116-1[3].
Il terzo capitolo invece definirà l’architettura dei test che andremo a svolgere. Verranno presentate
le scelte effettuate per quanto riguarda i segnali e le modalità di analisi, illustrato il procedimento di
confronto tra file e l’elaborazione dei dati ottenuti. Verranno inoltre presentati due esempi di test,
seguiti dall’acquisizione dei segnali alla generazione dei risultati.
Nel quarto capitolo verranno presentati i dati ricavati dagli esperimenti e i grafici ottenuti. Saranno
inoltre effettuati i confronti tra differenti versioni e modalità dei test.
Nel quinto capitolo vedremo le conclusioni a cui i risultati ci portano, e li confronteremo con gli
obiettivi di partenza. Vedremo inoltre i possibili studi e sviluppi futuri che conseguono dai risultati
acquisiti.
In appendice verranno esaminati gli script principali utilizzati per i test e per l’elaborazione dei dati.
4
5
Capitolo 2
Ricampionamento e valutazione della qualità audio
I test che andremo ad eseguire riguardano la valutazione della qualità audio percepita di segnali
ricampionati. In questo capitolo esporremo le basi teoriche riguardo al ricampionamento e alla
modalità di valutazione della qualità audio che è stata selezionata.
Per ricampionamento si intende la modifica della frequenza di campionamento di un segnale,
ovvero del numero di campioni al secondo utilizzati per rappresentarlo. Un campione è un valore
numerico, che nel caso dei segnali audio indica il valore di ampiezza rilevato in un istante
temporale. Nella prima parte di questo capitolo vedremo il campionamento, processo che permette
di descrivere attraverso campioni un segnale a tempo continuo. Esamineremo poi le tecniche
generali di ricampionamento. Faremo riferimento a segnali audio, che sono il campo di indagine di
questo lavoro. Le tecniche illustrate sono adatte anche ad altre tipologie di segnali.
2.1 Campionamento
I suoni che troviamo in natura sono composti da variazioni continue nel tempo della pressione
dell’aria. Un elaboratore digitale però può memorizzare e trattare unicamente sequenze finite di bit.
Per poter rappresentare digitalmente un segnale, è quindi necessario approssimarlo numericamente.
In particolare sarà necessario discretizzare temporalmente il suono, ovvero suddividere il continuum
temporale in un numero finito di istanti. Il procedimento utilizzato per compiere tale operazione è
chiamato campionamento: dato in input un segnale continuo, otterremo una serie di valori
equamente distanziati nel tempo. Tali valori sono detti campioni. Per frequenza di campionamento
(f
s
) si intende il numero di campioni utilizzati per rappresentare un secondo del segnale originale.
Per ottenere un segnale digitale, anche i valori di questi campioni dovranno essere discreti, quindi
rappresentabili con un numero finito di cifre. L’operazione che permette questo passaggio è la
quantizzazione.
Figura 1: esempio di segnale analogico Figura 2: lo stesso segnale campionato
In figura 1 e 2 troviamo un esempio di campionamento. Il primo segnale è a tempo continuo, il
secondo è campionato. T
c
rappresenta l’intervallo di campionamento, che deriva dalla frequenza
utilizzata (T
c
= 1/f
s
).
6
2.1.1 Teorema di Shannon – Nyquist
Un buon campionamento dovrebbe permettere di ricostruire il segnale originale partendo dai
campioni ottenuti. Perché questo sia possibile, dovremo avere una frequenza di campionamento
(ovvero un numero di campioni al secondo) adeguata a descrivere tutti i mutamenti del segnale.
Il teorema di Shannon – Nyquist, noto anche come teorema del campionamento, stabilisce che un
segnale a tempo continuo a banda limitata f
b
può essere campionato a frequenza di campionamento
f
s
> 2f
b
senza perdita di informazione. Il rispetto del teorema assicura la ricostruibilità del segnale
originale. Dai campioni estratti è infatti possibile riottenere il segnale a tempo continuo tramite
l’applicazione di un filtro passa basso con frequenza di taglio f
b
.
Figura 3: analisi nel dominio delle frequenze del segnale S(f) a banda limitata f
b
In figura 3 troviamo la rappresentazione nel dominio delle frequenze tramite trasformata di Fourier
di un segnale a tempo continuo e a banda limitata. Come si può notare non abbiamo alcuna
informazione frequenziale superiore a f
b.
Figura 4: analisi nel dominio delle frequenze del segnale S(f) campionato con f
s
> 2f
b
Campionando il segnale con una frequenza di campionamento che rispetti il teorema, osserviamo
che nel dominio delle frequenze lo spettro si ripete periodicamente. Fino a f
b
lo spettro coincide con
il segnale originale, e non ci sono sovrapposizioni tra le ripetizioni dello spettro. Con un semplice
filtro passa basso, possiamo eliminare tutte le frequenze superiori a f
b
e riottenere le informazioni
frequenziali del segnale originale.
Viene chiamata frequenza di Nyquist (f
N
) di un segnale la metà della frequenza di campionamento
utilizzata. (f
N
= f
s
/2). In teoria per avere un ricampionamento corretto basterebbe selezionare un
numero di campioni al secondo tale che la componente frequenziale più elevata del segnale in
esame coincida con la frequenza di Nyquist. In realtà nei ricampionamenti reali intervengono altri
fattori e conviene mantenere un certo margine tra f
N
e f
b
per assicurare una corretta salvaguardia
dell’informazione frequenziale.
Per rappresentare correttamente le informazioni frequenziali percepibili dall’orecchio umano, che
arrivano a circa 20000Hz, vengono utilizzate principalmente 2 frequenze di campionamento: 44100
campioni al secondo (standard cd Audio) o 48000Hz. In entrambi i casi la frequenza di Nyquist
supera abbondantemente la banda di interesse ma il margine assicura una corretta conservazione
dell’informazione.
L’utilizzo di frequenze di campionamento più basse di f
N
comporta l’impossibilità di ricostruire
fedelmente il segnale e la distorsione dell’informazione frequenziale. Le componenti che superano
la frequenza di Nyquist non solo non saranno udibili nel segnale campionato, ma apporteranno
7
alcune modifiche al suo spettro, riflettendosi e interferendo sulle altre componenti frequenziali.
Questo fenomeno è chiamato aliasing.
Figura 5: analisi nel dominio delle frequenze del segnale S(f) campionato con f
s
< 2f
b
Se non rispettiamo il teorema del campionamento le copie dello spettro nel dominio frequenziale si
sovrappongono. I valori delle frequenze più alte vengono quindi alterati, e non è più possibile
ricostruire lo spettro originale con un filtraggio.
Il fenomeno dell’aliasing è visibile anche nel dominio del tempo.
Figura 6: campionamento di una sinusoide con f
s
< 2f
b
e ricostruzione del segnale
Nella figura troviamo in rosso una sinusoide continua nel tempo, di frequenza f
1
che è stata
campionata con frequenza insufficiente. Dai valori rilevati nei campioni, indicati da quadrati blu, si
è tentato di ricostruire il segnale. I dati però non solo sono insufficienti, ma portano ad un risultato
erroneo: la sinusoide in blu, a frequenza molto più bassa, f
2
= 2f
s
– f
1
.
2.1.2 Filtraggio anti aliasing
Per evitare distorsioni nel campionamento di segnali le soluzioni possibili sono due: aumentare la
frequenza di campionamento, fino a farle raggiungere il doppio della banda passante. Soluzione
ottimale, ma non attuabile nel caso di segnali a banda non limitata, o qualora non fosse possibile
utilizzare una frequenza di campionamento elevata. Inoltre, per quanto riguarda segnali audio
finalizzati all’ascolto, è inutile conservare le informazioni frequenziali superiori ai 20000Hz, che
l’orecchio umano non è in grado di percepire.
In alternativa prima di procedere col campionamento è possibile eliminare le frequenze non
rappresentabili con la frequenza di campionamento desiderata. Per far questo viene applicato un
filtro passa basso con frequenza di taglio f
N
, ovvero un procedimento numerico che elimini tutte le
componenti frequenziali superiori alla frequenza di Nyquist.