1. Introduzione
I sistemi che sono stati sviluppati ai ni della localizzazione
sono dotati di un array di microfoni, che permette di ottenere ri-
sultati non raggiungibili nel caso in cui se ne usi uno solo. Ad
esempio e possibile ottenere un segnale ad alta qualit a da una
particolare locazione, attenuando simultaneamente altre voci o
sorgenti di rumore; si parla in questo caso di acquisizione di suo-
no selettiva, per quanto riguarda il punto di vista spaziale. Questo
viene poi fatto senza disturbare chi sta parlando, obbligandolo a
tenere in mano o a indossare un microfono; inoltre e possibile
modi care la direzione di ricezione senza richiedere alcun mo-
vimento sico. Un requisito fondamentale in sistemi di questo
tipo e proprio l’abilit a di localizzare una sorgente di suono ed
eventualmente seguirla nei suoi movimenti (tracking). Allo stes-
so tempo e possibile considerare uno scenario nel quale le sor-
genti di suono sono multiple (multi-speaker) e di conseguenza
focalizzare automaticamente su chi sta parlando attualmente.
Proprio in questo ambito, un’applicazione che ultimamente
suscita particolare interesse e quella delle video-conferenze [3],
nelle quali si vuole fare in modo di indirizzare le telecamere au-
tomaticamente, attivandole attraverso la voce di chi parla e sen-
za dover ricorrere all’utilizzo di alcun operatore umano (questo
compito e solitamente af dato ai partecipanti stessi). Questo ti-
po di soluzione rappresenta la pi u naturale possibile e solleva
gli utenti da questo incarico, che pu o essere gravoso o fonte di
distrazione.
In generale, le caratteristiche che possono essere richieste a
questi sistemi sono un’elevata accuratezza e af dabilit a, ma an-
che la capacit a di aggiornarsi con grande velocit a, in modo da
essere utili nelle numerose applicazioni real-time. Per quanto ri-
guarda la precisione delle stime effettuate, invece, sono diversi i
fattori che la in uenzano:
2
1. Introduzione
• la quantit a e la qualit a dei microfoni utilizzati;
• il collocamento dei microfoni, sia relativamente tra di loro,
sia nei confronti delle sorgenti da analizzare;
• la presenza di interferenze dovute a sorgenti di rumore e
ad ambienti soggetti a riverbero;
• il numero di sorgenti attive e il loro contenuto spettrale.
Particolare importanza ha il caso, assolutamente comune, in
cui si debba far fronte a sorgenti di rumore e a riverbero; in que-
st’ultima situazione, piu’ precisamente, si presentano fenomeni
di distorsione acustica per via dei cammini multipli (multipath)
che vengono percorsi dalle onde sonore, causati per lo pi u dalle
ri essioni di pareti, pavimento, sof tto e altri eventuali ogget-
ti ingombranti. Un effetto secondario e rappresentato poi dalle
eventuali dispersioni e diffusioni dovute a oggetti di dimensioni
comparabili alle lunghezze d’onda tipiche dei segnali acustici.
Obiettivi e contesto della tesi
La localizzazione rappresenta il fulcro attorno al quale e stato
sviluppato questo lavoro. Innanzitutto ci si propone di esporre
le strategie fondamentali con le quali e stato affrontato questo
problema, sulle quali sono infatti fondati gli innumerevoli algo-
ritmi e procedure che sono stati usati nelle svariate applicazioni
affrontate in letteratura.
La comprensione di ogni argomento scienti co passa poi at-
traverso le indispensabili prove sperimentali, che sono state ese-
guite con lo scopo di veri care come una tecnica di localizza-
zione possa essere effettivamente applicata. Oltre a ci o, bisogna
3
1. Introduzione
per o aggiungere le nalit a relative al contesto all’interno del qua-
le il progetto ha avuto luogo, cio e un gruppo di ricerca del dipar-
timento di ingegneria elettronica ed elettrica, EEE (Electronic &
Electrical Engineering), del Trinity College di Dublino, Irlanda.
Questo si occupa in generale di signal processing, compren-
dendo un’ampia gamma di attivit a che riguardano l’analisi e l’e-
laborazione di immagini e di segnali audio e video. In particola-
re, proprio all’inizio di questo anno accademico, e stato avviato
un progetto che ha il ne di investigare, partendo da ricerche
che concernono la modellizzazione acustica di stanze e l’ana-
lisi di campi sonori, appunto sulla localizzazione. Il problema
che si intende studiare, per l’esattezza, e quello di localizzare un
cantante o un oratore su un palco, all’interno ad esempio di un
coro o durante una rappresentazione teatrale; questa particola-
re applicazione, pur essendo collegata ad altre ricerche presenti
in letteratura, non e mai stata affrontata e rappresenta quindi un
argomento di notevole interesse.
Oltre a questo problema di analisi, all’interno del gruppo si
intende avviare delle ricerche riguardanti anche quello relativo di
sintesi. Pi u precisamente questo implica che i segnali audio ri-
cevuti dalle sorgenti di suono, sse o mobili che siano, una volta
processati per codi care le informazioni di localizzazione per-
mettano che queste siano aggiunte al sistema di ampli cazione e
trasmesse cos al pubblico.
Gli esperimenti eseguiti all’interno di questa tesi, per conclu-
dere, hanno perci o permesso di testare alcune apparecchiature e
strumenti e le loro relative con gurazioni, che verranno usati in
seguito dal gruppo di ricerca nel contesto degli studi descritti. Le
misure eseguite sono inoltre utili per la modellizzazione di una
stanza del dipartimento, che si intende usare per conferenze e
concerti musicali.
4
1. Introduzione
Guida alla lettura
Questo lavoro e fondamentalmente suddiviso in due parti, la pri-
ma delle quali e incentrata sulla descrizione, dal punto di vista
teorico, della materia trattata. A tal riguardo, gi a nel presente ca-
pitolo, sono state descritte le applicazioni di cui la localizzazione
e stata fatta oggetto in letteratura e si e parlato, inoltre, dei sistemi
di array di microfoni che vengono usati in questo tipo di contesto.
Tra tutte le strategie trattate, un particolare occhio di riguardo e
stato dato a due di esse, che vengono presentate in maniera pi u
approfondita, discutendone anche il relativo background mate-
matico; queste sono basate, rispettivamente, sulla differenza dei
tempi di arrivo, TDOA (Time Difference Of Arrival), e sulla per-
cezione del suono in maniera selettiva nello spazio. Queste tec-
niche infatti sono considerate di grande importanza, per l’ampio
utilizzo che ne e stato fatto e anche per il ruolo fondamentale che
hanno rivestito dal punto di vista storico. In particolare, il primo
di questi di approcci e stato proprio quello applicato negli esperi-
menti, dei quali si parla in modo dettagliato nella seconda parte.
Ecco un breve sommario del contenuto di ciascuno dei seguenti
capitoli:
Capitolo 2 espone i principali metodi che sono stati utilizzati
per risolvere il problema della localizzazione, partendo da
come questo viene affrontato dagli esseri umani.
Capitolo 3 mostra gli strumenti che sono stati utilizzati e il lo-
ro setup durante gli esperimenti. Particolare rilievo ha
tra questi l’analizzatore dinamico di segnali, poich·e mol-
to tempo e stato dedicato per familiarizzare con esso e
testarne il funzionamento.
5
1. Introduzione
Capitolo 4 descrive le prove sperimentali che sono state esegui-
te all’interno di questo progetto e i risultati ottenuti.
Capitolo 5 vengono tratte le conclusioni relative al lavoro svol-
to, esponendo risultati e possibili sviluppi futuri.
Figura 1.1: Il Trinity College di Dublino
6
Capitolo 2
La localizzazione
2.1 Cenni sulla localizzazione negli esse-
ri umani
Lo studio della localizzazione negli esseri umani [4, 5], che a
tal riguardo vengono considerati sistemi binaurali, cio e con due
orecchie, ha fornito molte idee utili per le applicazioni di tipo
arti ciale. In queste, infatti, viene fatto uso di una molteplicit a
di microfoni distribuiti nello spazio; le varie tecniche sono poi
basate sull’analisi delle differenze tra i segnali ricevuti dai diversi
punti di osservazione. Se assumiamo che la sorgente possa essere
considerata come un punto nello spazio (questo modello e valido
se, considerando una coppia di punti di osservazione, la distanza
relativa tra essi e molto pi u piccola di quella di ciascuno dei due
con la sorgente), allora e possibile utilizzare due principi ai ni
della localizzazione: la differenza di intensit a interaurale (IID) e
la differenza di tempo interaurale (ITD).
Il primo e dovuto al fatto che le onde sonore hanno un’inten-
sit a che decade gradualmente con la distanza, pi u precisamen-
te in maniera proporzionale al suo quadrato. In generale que-
sto effetto non pu o essere utilizzato in ambienti piccoli, a causa
7
2. La localizzazione
dell’elevato numero di ri essioni. Negli uomini tuttavia assu-
me un’importanza decisamente maggiore per via dell’effetto om-
bra della testa, che attenua in maniera diversa il livello dei due
segnali ricevuti a seconda della direzione da cui provengono.
Il secondo principio, invece, si ottiene assumendo che la di-
stanza tra la sorgente e ciascun punto di osservazione sia diffe-
rente; di conseguenza le onde sonore vengono ricevute in istanti
diversi, avendo la velocit a del suono un valore nito. Conoscen-
do quest’ultimo valore e la differenza dei tempi di arrivo, e pos-
sibile ottenere una stima della posizione della sorgente stessa; in
tali condizioni questa e infatti vincolata a trovarsi su un’iperbole,
se si considera uno spazio bidimensionale, o su un’iperboloide,
nel caso tridimensionale. 1 Questa tecnica e per l’appunto cono-
sciuta comunemente come TDOA e, utilizzando diverse coppie
di sensori, pu o essere utilizzata per localizzare accuratamente la
sorgente. Nel caso umano, invece, il ritardo tra i due segnali ri-
cevuti provoca una differenza di fase, che il cervello e in grado
di riconoscere e processare.
Un ascoltatore e in grado inoltre di localizzare sul piano ver-
ticale sorgenti per le quali le differenze interaurali sono nulle e
di distinguere quindi un suono che arriva dal davanti da uno dal
di dietro. Questo fatto e dovuto dal modo differente col qua-
le le orecchie, la testa, le spalle e la parte superiore del busto
disperdono le onde sonore a seconda della loro direzione; que-
sta diffusione determina un ltraggio acustico dei segnali, che
pu o essere descritto tramite una funzione di trasferimento deno-
minata HRTF (Head Related Transfer Function), o funzione di
trasferimento anatomica.
1L’ iperbole si definisce proprio come il luogo geometrico dei punti del piano per i quali e`
costante la differenza delle distanze da due punti fissi, detti fuochi; si chiama invece iperbo-
loide (a una falda) il solido ottenuto da una rotazione di pi di un’iperbole attorno all’asse di
simmetria (la retta su cui giacciono i fuochi).
8