2
dall EBU4 in appendice ai suoi documenti tecnici riguardanti la valutazione soggettiva di materiale
per test d ascolto.
Attraverso questi documenti abbiamo isolato una serie di attributi che descrivono, in parte o in
maniera globale, la qualit audio percepita. Abbiam o definito quindi l attributo principale, basic
audio quality, atto a descrivere nell insieme tutti gli aspetti riguardanti la qualit del suono, e
abbiamo introdotto l esistenza di attributi specifici riguardanti la qualit del suono stereofonico a
due o piø canali e la relazione tra suono e immagine di accompagnamento. Ampia trattazione Ł stata
data dunque alle categorie definite dall EBU e adottate dall ITU-R per la classificazione degli
attributi che descrivono la qualit audio. Ogni cat egoria Ł stata presentata facendo riferimento alle
sue sottocategorie e ai descrittori verbali utilizzati di regola per valutarle. Oltre agli attributi spaziali
e riguardanti il suono stereofonico, le categorie comprendono la trasparenza del suono, il
bilanciamento sonoro, il timbro o colore sonoro, la presenza o meno di suoni e distorsioni e
l impressione generale della qualit sonora.
Dovendo trattare nello specifico i supporti fonografici digitali e analogici, Ł stato necessario fornire
anche spazio ai vari tipi di artefatto (ovvero qualsiasi disturbo alla qualit ) che si presentano
rispettivamente nell audio digitale e nell audio an alogico. Per quanto riguarda l audio digitale ci
siamo soffermati in particolare sui difetti di quantizzazione, sulla distorsione non-lineare e sulla
distorsione temporale, mentre trattando l audio analogico abbiamo attuato una divisione, trattando
in maniera separata gli artefatti che causano degrado durante la registrazione o la riproduzione di un
disco piuttosto che di un nastro magnetico.
Dopo aver definito il concetto di qualit audio, ab biamo voluto trattare le problematiche e gli
standard per la misurazione della qualit audio. Ab biamo per prima cosa analizzato tutte le
problematiche legate alla forma piø comune di misurazione della qualit : le misurazioni soggettive,
ovvero condotte attraverso test d ascolto. Dopo aver brevemente introdotto quali siano i problemi a
livello logistico, abbiamo via via discusso quali siano i formati della domanda di ricerca e della
4
Vedi nota 8 capitolo I
3
risposta, operando una divisione tra misurazioni affettive (ovvero riguardanti l impressione
soggettiva complessiva di uno stimolo) e misurazioni percettive (riguardanti l impressione
soggettiva rispetto a un certo numero di attributi riferiti a uno stimolo). Trattando il formato di
risposta abbiamo fornito una panoramica dei formati e delle procedure utilizzate per la graduazione
e l ordinamento degli stimoli, oltre a una carrellata delle principali tipologie di errore sistematico o
contestuale.
Una parte piuttosto importante del lavoro riguarda la definizione delle variabili sperimentali: il
segnale, le variabili elettroacustiche e tecniche, il soggetto. Le problematiche riferite al segnale
riguardano la categoria del segnale (discorso parlato o segnale musicale, segnale naturale o segnale
sintetico), la tecnica di registrazione, memorizzazione e codifica e le caratteristiche spaziali,
temporali e frequenziali dello stesso. Una categoria a parte Ł formata dai cosiddetti segnali di
riferimento, che fungono da paragone con cui tutti gli altri segnali vengono confrontati. Le variabili
elettroacustiche e tecniche sono riferite a tutto quello che riguardi la condizione ambientale di
ascolto: spazi, sistemi di riproduzione e di ascolto. La variabile piø difficilmente descrivibile Ł
quella del soggetto, che nei test d ascolto funge da strumento di misurazione della qualit . Il
soggetto va categorizzato a seconda del suo addestramento e delle sue capacit , pu essere
sottoposto a preselezione e postselezione o inserito in panel d ascolto, ovvero gruppi
semipermanenti di persone utilizzate per condurre i test, e dovr avere la possibilit di acquistare
familiarit con l esperimento. Sono state prese in esame inoltre alcune considerazioni statistiche
elementari, necessarie per la buona riuscita dell esperimento e per una corretta analisi dei dati dello
stesso.
Dopo aver trattato i test soggettivi, abbiamo presentato l utilizzo di misurazioni oggettive, che si
basano sull utilizzo di modelli predittivi studiati per fornire una stima accurata della reazione
umana a un dato stimolo sensoriale. Questi modelli, seppur tuttora non sufficientemente evoluti da
poter soppiantare in tutto e per tutto i test d ascolto, sono una buona alternativa ad alcune
misurazioni soggettive, mantenendo al minimo i costi economici e i problemi logistici di un
4
esperimento.
Infine, abbiamo analizzato i vantaggi derivanti da un approccio standardizzato, presentando i
principali standard ITU-R per le misurazioni soggettive e oggettive della qualit audio sotto diversi
aspetti, quali: la scelta dei soggetti, degli attributi da esaminare e del materiale d ascolto; i metodi di
valutazione, graduazione e test o, nei test oggettivi, le variabili di output; le condizioni di ascolto;
l analisi statistica e la presentazione dei risultati.
Il test vero e proprio Ł stato condotto attraverso l esame di due estratti, acquisiti nei vari formati.
Abbiamo descritto come prima cosa le specifiche tecniche di tali formati, soffermandoci sui metodi
e sulle attrezzature utilizzate per acquisire gli stessi. In seguito abbiamo descritto la procedura
utilizzata per il test d ascolto individuale da noi condotto, presentando il questionario sottoposto a
ogni soggetto, le variabili sperimentali controllate e i risultati ottenuti.
5
CAPITOLO I
DEFINIZIONE DI QUALIT AUDIO
Il concetto di "qualit audio" Ł un concetto molto ampio, che comprende diversi aspetti, legati al
tipo di supporto tramite cui l’audio viene fruito, alla quantit di canali, all’utilizzo del segnale e ad
altri fattori ancora. In questo capitolo ci siamo proposti di definirla, basandoci sugli standard
principali in vigore e descrivendone i principali attributi, oltre ai motivi di degrado piø
frequentemente presenti nei supporti che vengono piø spesso usati.
In prima battuta, si Ł definito l’attributo basic audio quality (paragrafo 1), comprensivo di ogni
aspetto riguardante la qualit del suono da valutar e, per poi presentare gli attributi specifici per la
qualit del suono stereofonico (paragrafo 2) e la r elazione tra suono e immagine di
accompagnamento (paragrafo 3). Nel paragrafo 4 ci siamo soffermati su tutti i principali attributi
per la valutazione assoluta della qualit del suono , specificando alcune categorie di parametri e
definendo gli attributi facenti parte delle stesse.
Infine, nei paragrafi 5 e 6 abbiamo esaminato piø da vicino gli attributi riferiti rispettivamente alla
qualit dell’audio digitale e analogico. Per l’audio digitalmente codificato o trasmesso, basandoci su
quanto espresso dalle principali raccomandazioni nel campo, abbiamo presentato i principali
fenomeni di degradazione (difetto di quantizzazione, distorsione non lineare, distorsione temporale)
e elencato una serie di artefatti che possono andare a danneggiare il segnale sorgente. Per quanto
riguarda invece la degradazione dell’audio analogico, Ł stato necessario operare una distinzione tra
gli artefatti propri del disco analogico e quelli propri del nastro magnetico.
1. BASIC AUDIO QUALITY
Secondo la definizione data nella Raccomandazione BS.1284-1 della ITU-R 1 Methods for the
1
La ITU-R Ł il Settore Radiocomunicazioni della International Telecommunication Union (ITU), il cui ruolo Ł
6
Subjective Assessment of Sound Quality General Re quirements2 l’attributo basic audio quality
contiene tutti gli aspetti della qualit del suono che si sta valutando, tra cui ma non solo il
timbro, la trasparenza, l’immagine stereofonica, la presentazione spaziale, la riverberazione, la
presenza di echi, le distorsioni armoniche, il rumore di quantizzazione, la presenza di click e pop e il
rumore di sottofondo. Se lo scopo dell indagine Ł rilevare la presenza di deterioramento del segnale,
la basic audio quality Ł altrimenti definita nella Raccomandazione BS.1116-1 della ITU-R Methods
for Subjective Assessment of Small Impairments in Audio Systems Including Multichannel Sound
Systems3 come il singolo attributo globale usato per descrivere qualsiasi differenza riscontrata tra il
segnale di riferimento e il segnale che si sta analizzando (signal under test). La Raccomandazione
BS.1116-1 suggerisce che tale parametro venga sempre utilizzato per la valutazione di un segnale.
Potremmo definire quindi la basic audio quality come il parametro di riferimento per eccellenza
nella valutazione della qualit audio di un segnale sonoro.
2. IMMAGINE STEREOFONICA
La Raccomandazione BS.1284-1 della ITU-R definisce l immagine stereofonica (stereophonic
image) come una categoria di attributi che specificano nel dettaglio la qualit stereofonica del suono
a due o piø canali. Gli attributi si distinguono a seconda della quantit di canali del segnale che si
sta analizzando, in particolare a seconda che il suono sia diviso su due canali o se sia multicanale.
La Raccomandazione BS.1116-1 cita in entrambi i casi anche l attributo basic audio quality,
definito come il singolo attributo globale per descrivere qualsiasi differenza riscontrata tra il segnale
di riferimento e il segnale analizzato.
sviluppare standard per i sistemi di radiocomunicazione.
2
Metodi per la valutazione soggettiva della qualit del suono requisiti generali
3
Metodi per la valutazione soggettiva di piccoli d eterioramenti in sistemi audio, inclusi sistemi multicanale
7
2.a. QUALIT DELL IMMAGINE STEREOFONICA A DUE CANAL I
L attributo stereophonic image quality4, secondo la Raccomandazione BS.1284-1, Ł relativo alle
differenze tra il segnale di riferimento e il segnale analizzato in termini di localizzazione
dell immagine sonora e sensazione di profondit e r ealismo dell evento sonoro. La
Raccomandazione BS.1116-1, pur definendo la stereophonic image quality con la stessa formula,
avverte che non esiste sufficiente ricerca che assicuri che un giudizio separato degli attributi
stereophonic image quality e basic audio quality sia garantito.
2.b. QUALIT DELL IMMAGINE STEREOFONICA MULTICANALE
Per quanto riguarda l uso di piø canali, la Raccomandazione BS.1284-1 definisce due attributi
distinti, ovvero la front image quality5 e la impression of surround quality6. La front image quality
verr trattata piø avanti (paragrafo 4). La impression of surround quality tratta l impressione
spaziale, l ambience7 e eventuali effetti speciali direzionali.
3. RELAZIONE TRA SUONO E IMMAGINE DI ACCOMPAGNAMENTO
La Raccomandazione 1284-1 definisce una serie di attributi che specificano la correlazione tra
suono e immagine di accompagnamento. Questi attributi includono la correlazione della posizione
delle fonti sonore derivate da suggerimenti visivi o da suggerimenti sonori (azimut, elevazione,
profondit ), la correlazione delle impressioni spaz iali tra suono e immagine e le relazioni temporali
tra audio e video.
4
Qualit dell immagine stereofonica
5
Qualit dell immagine frontale
6
Qualit dell impressione ambientale
7
Per ambience si intende the surroundings or atmosphere of a place (l ambiente o atmosfera di un luogo)
8
4. PRINCIPALI ATTRIBUTI PER LA VALUTAZIONE ASSOLUTA DELLA
QUALIT DEL SUONO
La EBU8 definisce nell Appendice B del suo Documento Tecnico Tech 3286 (Assessment methods
for the subjective evaluation of the quality of sound programme material Music 9 ) e nel
Supplemento 1 allo stesso (Assessment methods for the subjective evaluation of the quality of sound
programme material Multichannel 10 ) una lista di principali parametri raccomandati per la
valutazione soggettiva di musica classica o per qualsiasi performance acustica che prenda luogo in
uno spazio reale. Il documento viene citato anche come appendice nella Raccomandazione ITU-R
BS.1284-1 oltre che nella EBU Technical Review 274 (Subjective Assessment of Audio Quality
the means and methods within the EBU11). Le liste sono differenti a seconda che si parli di audio a
due canali o di audio multicanale. Nel primo caso viene definito un attributo singolo per
l impressione stereofonica, stereo impression. Nel caso di audio multicanale sono invece definiti
due parametri distinti, front image quality e side and rear sound quality, che sostituiscono
l impressione stereofonica. Anche alcuni degli altri parametri sono definiti in maniera leggermente
diversa nei due casi, come tratteremo nello specifico nei paragrafi riguardanti detti parametri. Tutti
gli attributi e i sottoattributi descritti nell Appendice B sono definiti nell Appendice C del
Documento Tecnico 3286. Ogni attributo principale, nella tabella, Ł definito da un certo numero di
sottoparametri, che possono essere considerati una descrizione dettagliata dell attributo principale.
La tabella fornisce anche, per ogni attributo principale, una serie di coppie di termini di uso comune
usati per descrivere il parametro in questione.
8
La EBU Ł la European Broadcasting Union, un associazione di emittenti nazionali che promuove la collaborazione tra
le emittenti per facilitare lo scambio di contenuti audiovisivi.
9
Metodi di accertamento della valutazione soggetti va della qualit di materiale audio per test d asco lto Musica
10
Metodi di accertamento della valutazione soggetti va della qualit di materiale audio per test d asco lto Multicanale
11
Valutazione soggettiva della qualit audio I mo di e metodi all interno dell EBU
9
4.a. STEREO IMPRESSION
La stereo impression12, secondo la tabella della EBU, Ł l impressione soggettiva che l immagine
sonora abbia la corretta e appropriata distribuzione direzionale delle fonti sonore. I sottoparametri
che la definiscono sono quattro:
• Directional balance13, ovvero l impressione soggettiva che le fonti sonore dell immagine
sonora siano posizionate in modo che l intera immagine risulti bilanciata.
• Stability14, ovvero l impressione soggettiva che tutte le fonti sonore mantengano le posizioni
previste.
• Sound image width15, l impressione soggettiva di un appropriata larghe zza del palco sonoro
nel campo del suono stereofonico.
• Location accuracy16, l impressione soggettiva che tutte le fonti sonore siano posizionate in
maniera accurata nell immagine sonora.
La tabella EBU fornisce anche due coppie di termini descrittivi comunemente utilizzati, riferiti al
parametro stereo impression: Wide/Narrow (Largo/Stretto) e Precise/Imprecise (Preciso/Impreciso).
4.b. FRONT IMAGE QUALITY
La tabella EBU definisce la front image quality come l appropiata e corretta distribuzione
direzionale dell immagine sonora frontale (front sound image). ¨ un parametro che viene usato
solamente in caso di audio multicanale. Quattro sono i sottoparametri che definiscono la front
image quality, analoghi ai quattro parametri con cui viene definita in caso di audio a due canali la
stereo impression: directional balance, directional stability, sound image width e location
accuracy.
Tra i termini descrittivi, oltre alle coppie Wide/Narrow (Largo/Stretto) e Precise/Imprecise
12
Impressione stereofonica
13
Bilanciamento direzionale
14
Stabilit
15
Larghezza dell immagine sonora
16
Accuratezza di localizzazione della sorgente sonora
10
(Preciso/Impreciso) che descrivevano la Stereo Impression, la tabella fornisce altre due coppie:
Stable/Unstable (Stabile/Instabile) e Localizable/Unlocalizable (Localizzabile/Non localizzabile).
Secondo la Raccomandazione BS.1284-1, la front image quality Ł l attributo per la descrizione
dell audio multicanale relativo alla localizzazione delle fonti sonore, e include l attributo
stereophonic image quality e eventuali perdite di definizione.
4.c. SIDE AND REAR SOUND QUALITY
La side and rear sound quality17 Ł definita dalla tabella EBU solo nel caso di audio multicanale. Si
riferisce all impressione soggettiva che i suoni provenienti dai lati e da dietro abbiamo il corretto e
appropriato bilanciamento. I sottoparametri che definiscono tale attributo sono quattro. Oltre al
directional balance, alla directional stability e alla location accuracy, Ł definito il sottoparametro
homogeneity of spatial sound18 (che nel caso di audio a due canali viene definito come facente parte
del parametro spatial impression), ovvero l impressione soggettiva che lo spazio sonoro sia un
insieme omogeneo.
Le coppie di termini che la tabella fornisce per descrivere la side and rear sound quality sono
utilizzate anche nella descrizione della front image quality e sono la coppia Stable/Unstable
(Stabile/Instabile) e la coppia Localizable/Unlocalizable (Localizzabile/Non localizzabile).
4.d. SPATIAL IMPRESSION
La spatial impression19 Ł l attributo riguardante l impressione soggettiva che la performance abbia
luogo in un ambientazione spaziale appropriata. Viene definito da sei sottoparametri:
• Homogeneity of spatial sound, ovvero l impressione soggettiva che lo spazio sonoro sia un
insieme omogeneo.
17
Qualit del suono proveniente da lati e retro
18
Omogeneit dello spazio sonoro
19
Impressione spaziale
11
• Reverberance20, ovvero l impressione soggettiva dell appropriata durata di suoni indiretti
naturali o artificiali.
• Acoustical balance21, l impressione soggettiva della relazione tra i suoni diretti e indiretti
(riflessi).
• Apparent room size22, l impressione della dimensione apparente (effettiva o artificiale) della
stanza di originazione del suono.
• Depth perspective23 , l impressione soggettiva che l immagine sonora ab bia un adeguata
profondit da fronte a retro. L Appendice C, define ndo la depth perspective, si raccomanda
che i soggetti siano al corrente del fatto che questo sottoparametro pu essere un artefatto
delle condizioni di ascolto, piuttosto che un parametro di una registrazione stereo a due
canali.
• Sound colour of reverberation24 , l impressione soggettiva di un colore sonoro naturale
nell acustica dello spazio, riverberi artificiali inclusi. Il colore sonoro Ł definito come
l insieme di elementi armonici caratteristici di una sorgente sonora.
Nel caso di audio multicanale la tabella EBU definisce una diversa lista di sottoparametri per
descrivere la spatial impression. La homogeneity of spatial sound diventa in questo caso un
sottoparametro della side and rear sound quality, mentre il sound colour of reverberation Ł un
attributo legato al parametro sound colour. Per l audio multicanale, oltre ai sottoattributi
reverberance, acoustical balance, apparent room size e depth perspective, viene usato il
sottoattributo spatial reality25.
Sia nel caso di audio a due canali, sia nel caso di audio multicanale, la tabella EBU definisce le
medesime coppie di termini di uso comune per descrivere l attributo spatial impression: Room
reverberate/dry (Stanza riverberante/asciutta), Direct/Indirect (Diretto/Indiretto) e Large
20
Riverberazione
21
Bilanciamento acustico
22
Dimensione apparente della stanza
23
Prospettiva di profondit
24
Colore sonoro di riverberazione
25
Realismo spaziale
12
room/Small room (Stanza grande/Stanza piccola).
4.e. TRANSPARENCY
La transparency26 Ł il parametro riferito all impressione soggettiva di poter percepire con chiarezza
tutti i dettagli della performance. Sia nel caso di audio a due canali, sia nel caso di audio
multicanale viene definito dagli stessi sottoattributi:
• Sound source definition 27 , l impressione soggettiva di poter identificare e distinguere
differenti strumenti e voci emessi simultaneamente.
• Time definition28, l impressione soggettiva che singoli suoni corti in rapida successione
possano essere identificati e distinti.
• Intelligibility29, la possibilit di distinguere le parole nel testo parlato o cantato.
La tabella EBU elenca una singola coppia di termini di uso comune per descrivere l attributo
transparency: Clear/Muddy (Chiaro/Confuso).
4.f. SOUND BALANCE
Il parametro sound balance30 Ł l impressione soggettiva del bilanciamento delle singole sorgenti
sonore nell immagine sonora generale. Nel caso di audio multicanale Ł definito unicamente come
balance31 e riguarda l appropriata relazione tra l ambience e l intensit sonora ( loudness) delle
singole sorgenti sonore.
Il parametro sound balance Ł definito dai sottoparametri loudness balance 32 (l impressione
26
Trasparenza
27
Definizione delle sorgenti sonore
28
Definizione temporale
29
Intelligibilit
30
Bilanciamento sonoro
31
Bilanciamento
32
Bilanciamento dell intensit sonora
13
soggettiva dell appropriata forza relativa delle varie sorgenti sonore) e dynamic range 33
(l impressione soggettiva che l escursione tra i li velli piø forti e piø deboli durante la riproduzione
rispecchi le aspettative dell ascoltatore per materiale sonoro di quel tipo).
Nel caso di audio multicanale i sottoattributi che definiscono il parametro balance sono tre:
• Dynamic range, definita nello stesso modo del sottoparametro dell attributo sound balance.
• Front/rear loudness balance34, l impressione soggettiva che la relazione tra la loudness dei
suoni frontali e dei suoni provenienti dal retro sia appropriata per il tipo di materiale sonoro.
• Direct/indirect loudness balance35, l impressione soggettiva che la relazione tra la loudness
dei suoni diretti e dei suoni indiretti sia appropriata per il tipo di materiale sonoro.
Entrambi i parametri (sound balance e balance) possono essere descritti dalle medesime coppie di
termini di uso comune: Sound source too loud/too weak (Sorgente sonora troppo forte/troppo
debole) e Sound compressed/natural (Suono compresso/naturale).
4.g. TIMBRE E SOUND COLOUR
La tabella EBU definisce due parametri distinti per descrivere le caratteristiche delle sorgenti
sonore, a seconda che si parli di audio a due canali o di audio multicanale.
Nel caso di audio a due canali il parametro di riferimento Ł l attributo timbre36, definito come
l accurata rappresentazione delle diverse caratteri stiche sonore delle sorgenti sonore e descritto dai
sottoparametri sound colour 37 (l impressione soggettiva che ogni sorgente abbia un suono
appropriato che includa tutti i suoi elementi armonici caratteristici) e sound attack38 (l impressione
soggettiva della velocit a cui il suono inizia, ov vero una combinazione del grado a cui il suono
aumenta in un brevissimo periodo e della durata di tale periodo).
33
Escursione dinamica
34
Bilanciamento dell intensit sonora fronte/retro
35
Bilanciamento dell intensit di suoni diretti e in diretti
36
Timbro
37
Colore sonoro
38
Attacco del suono