Premessa
Sono stato all’estero a presentare davanti a tali esperti gran parte del lavoro fatto
in questi mesi, approfondendo la conoscenza della lingua inglese e delle
tematiche del lavoro di gruppo.
Da ultimo, ma non per importanza, ho acquisito una buona esperienza - “…suona
la tua tromba perché nessuno la suonerà per te” (Russell Baker) - sia nel campo
dell’analisi dei dati, sia in quello delle comunicazioni su rete.
Vorrei ringraziare il relatore della tesi, Prof. Arnaldo D’Amico, per la
gentilissima opportunità che mi ha consentito di compiere questo lavoro, il
correlatore nonché amico, Ing. Fabrizio Davide, per i preziosi insegnamenti, la
guida continua, l’assistenza immancabile, lo stimolo perfezionista ininterrotto e
costante in dodici mesi di attività. Ed anche per quei suoi discorsi che dovrebbero
essere non didattici ma lo sono comunque. Ed infine per avermi insegnato l’arte
della ricerca con il cesello, la differenza tra il know-what ed il know-how, l’arte
di valorizzare i risultati.
Università di Roma “Tor Vergata”
Roma, 15 Settembre 1998.
CAPITOLO 1: Il naso elettronico
1.1. Il naso umano e il naso elettronico
Lo sviluppo dei sensori chimici, ossia quelli per il riconoscimento delle miscele
di gas, ha reso possibile, negli ultimi anni, la creazione del naso elettronico (EN),
un sistema in grado di distinguere tipi diversi di odori.
Il sistema olfattivo dell’uomo è molto complesso, tanto che i suoi segreti non
sono ancora stati del tutto svelati. Sull’epitelio olfattivo, all’interno delle fosse
nasali, ci sono approssimativamente dieci milioni di recettori nervosi, ciascuno
dei quali è sensibile ad un gran numero di composti chimici presenti in fase
gassosa. La risposta di un recettore è dovuta all’attivazione di canali ionici nella
membrana cellulare, i quali sono attivati da reazioni tra proteine sulla membrana.
Il tutto avviene in un lasso di tempo dell’ordine di qualche secondo. Recettori
vicini hanno profili di sensibilità simili, ossia sono sensibili perlopiù alle stesse
molecole. Un così elevato numero di recettori, fornisce una forte variazione della
sensibilità, sufficiente a provocare una sensazione molto diversa per gas diversi. I
segnali elettrici sono trasferiti dai recettori ai neuroni di una struttura organizzata
al di sopra del vomere, il bulbo olfattivo, attraverso circuiti neuronali costituiti da
assoni e sinapsi. Nel bulbo olfattivo ci sono molti neuroni, che insieme formano
una sottorete largamente autonoma. Tale rete processa l’informazione e poi
trasferisce i dati processati alla corteccia olfattiva. Qui ha luogo il processamento
finale, fatto da altre reti di neuroni, e la comunicazione con il resto del cervello.
Questa nuova informazione insieme alla conoscenza immagazzinata, è utilizzata
dal cervello per rivelare il tipo di odore.
In un naso elettronico ci sono tipicamente da 5 a 20 sensori, la loro sensibilità è
sovrapposta, ma a causa del numero così piccolo di sensori l’entità della
sovrapposizione, come anche lo spettro delle sensibilità, sono generalmente
molto più limitate di quelle del sistema dei recettori nel naso umano. La risposta
Capitolo 1 Introduzione
10
di un sensore chimico è generalmente misurata come variazione di una
caratteristica fisica. I tempi di risposta di questi dispositivi vanno da dieci
secondi a pochi minuti. Ridurre tali tempi di risposta è uno degli obiettivi
principali del settore. Risposte veloci sono già state ottenute per sensori ottici e
per sensori ad alte temperature. Problemi di costo e ingombro per i primi e la
necessità di un riscaldatore con relativa elevata dissipazione di potenza per i
secondi, rendono problematico il loro utilizzo in strumenti commerciali.
1.2. L’importanza dei nasi elettronici per l’utilizzo automobilistico
La domanda di sensori per il riconoscimento dei gas è cresciuta
esponenzialmente negli ultimi anni: il mercato di tali sensori è passato da 616
milioni di ECU nel 1992 a 1453 milioni di ECU nel 1998, ad un tasso annuale di
crescita del 15,5%. I sensori per applicazioni automobilistiche occupano, e
continueranno ad occupare in futuro, quote sempre più rilevanti in tale mercato,
basti pensare che sono passati dal 47% del 1992 al 60% del 1998. Ancor oggi
c’è una superiorità dei fornitori giapponesi, infatti i sensori a stato solido
commercialmente disponibili nell’analisi della qualità dell’aria sono tutti basati
su variazioni dei vecchi sensori Taguchi, dei quali sono ben noti i problemi di
stabilità a lungo termine e di sensibilità verso composti indesiderati (cross-
sensitivity).
Nuove opportunità di impiego sono rappresentate dal monitoraggio ambientale e
dal monitoraggio della qualità dell’aria indoor.
Molto spesso l’obiettivo non è un’analisi in termini di quantificazione esatta dei
gas componenti la miscela esaminata, ma piuttosto la rivelazione e la
quantificazione approssimata di classi o miscele di gas presenti nell’aria, o ancor
più semplicemente la rivelazione di una deviazione da una qualità accettabile o
da uno stato normale di un processo.
Capitolo 1 Introduzione
11
1.3. Il progetto CIA
La presente tesi è stata sviluppata all’interno del progetto dell’ Unione Europea,
“Electronic Chemical Imaging for Automative Applications” (CIA), inserito nel
programma Brite-Euram con il codice BE95-1910. Il progetto CIA ha come
partner contrattisti le Università di Warwick (Inghilterra, UW), di Tuebingen
(Germania, IPC), di Linköping (Svezia, LIU), di Neuchatel (Svizzera, IMT), di
Roma “Tor Vergata” (TVRU) e le aziende FIAT (CRF) e VDO (VDO),
quest’ultima tedesca e produttrice di componentistica elettronica e meccanica di
precisione per applicazioni automobilistiche, facente parte della multinazionale
dell’elettronica e dei media Mannesmann, e come partner subcontrattisti,
l’Università di Southampton (Inghilterra, US) e la Telecom Italia (TI). Il progetto
CIA, della durata di tre anni e partito il 1° Maggio 1996, si propone di realizzare
un sistema multisensore detto naso elettronico, per applicazioni di
riconoscimento di odori e di miscele gassose sugli autoveicoli. Il sistema trova i
suoi punti di forza in sensori chimici evoluti prodotti mediante la micro-
tecnologia al silicio, e su tecniche dedicate di elaborazione del segnale e di
pattern recognition.
1.4. I sensori per l’EN
Allo scopo di costruire dei buoni sensori di gas la tecnologia tende ad individuare
materiali allo stato solido capaci di subire variazioni significative e reversibili di
una loro proprietà fisico-elettrica, come le caratteristiche di trasporto elettrico o
di polarizzazione elettromagnetica, quando esposti a specie chimiche in fase
gassosa. In generale un generico materiale è sensibile a più composti chimici, in
quantità diversa: la sua selettività si dice tanto più elevata quanto minore è il
numero di composti cui il materiale risponde. Questa risposta dipende anche
dalle condizioni fisiche in cui si trovano a contatto il materiale e la miscela
Capitolo 1 Introduzione
12
gassosa. La risposta di un sensore è quindi influenzata da molti parametri, e di
converso nascono molti problemi durante la fabbricazione e l’uso di tali
dispositivi. Per nominare la sola fabbricazione di dispositivi per un uso massivo,
occorre curare contemporaneamente le esigenze seguenti: basso costo, piccole
dimensioni, basso consumo di potenza, alta riproducibilità, brevi tempi di
risposta, buona reversibilità, selettività ben controllata e segnale stabile. Nel
progetto CIA sono stati impiegati quattro tipi diversi di sensori: QMB, SnO2,
MOSFET e CP.
I sensori QMB (Quartz Micro Balance), visibili in figura 1.1. sono
costituiti da un materiale piezoelettrico, sulla cui superficie viene depositato uno
strato sensibile capace di assorbire le molecole del gas. Tale assorbimento
accresce la massa e lo spessore dello strato sensibile, causando la diminuzione
della frequenza delle onde rilevabili da un circuito oscillatore esterno.
Tale frequenza infatti varia in ragione del diametro e dello spessore del quarzo
(cui va aggiunto lo strato sensibile), oltreché del taglio, della temperatura e della
pressione. La presenza del materiale piezoelettrico, di cui sono esempi i cristalli
di Niobato di Litio (LiNbO
3
) e Tantalato di Litio (LiTaO
3
), permette di
trasformare un segnale elettrico in onda meccanica e viceversa.
materiale piezoelettrico
V
0
contatto metallico
strato sensibile
(isolante)
contatto metallico
materiale piezoelettrico
strato sensibile
Figura 1.1. Vista laterale e frontale di un dispositivo QMB.
I sensori ad ossido di stagno (SnO
2
) sono senza dubbio i più comuni
sensori per gas a stato solido. Le molecole del gas possono essere
chemioassorbite oppure partecipare alla reazione catalitica, sulla superficie del
sensore, provocando forti variazioni della conducibilità del dispositivo.
Capitolo 1 Introduzione
13
Quando un cristallo di un ossido di metallo è scaldato ad una certa temperatura,
l’ossigeno viene adsorbito sulla superficie del cristallo per mezzo di una carica
negativa. Quindi gli elettroni sulla superficie del cristallo sono trasferiti
all’ossigeno adsorbito, permettendo la creazione di uno strato di carica spaziale
positiva, che ha l’effetto di una barriera di potenziale contro il flusso di elettroni.
All’interno del sensore la corrente fluisce tra le superfici di contatto dei
microcristalli, in tali zone l’ossigeno adsorbito genera una barriera di potenziale
che si oppone al libero movimento dei portatori. La resistenza elettrica del
sensore è attribuita a questa barriera di potenziale. In presenza di un gas
riducente, la densità superficiale di ossigeno negativamente carico diminuisce,
con essa l’altezza della barriera di potenziale e quindi la resistenza del sensore.
Sensori con caratteristiche diverse possono essere ottenuti utilizzando pezzi di
cristalli singoli, film spessi (altamente porosi) ottenuti per sinterizzazione, film
sottili realizzati con la tecnica dello sputtering ed infine drogando il materiale
con Pt, Pd, Sb o In. Il drogaggio è necessario per incrementare la specificità del
materiale modulandone l’attività catalitica.
Figura 1.2. Realizzazione di un sensore SnO2, con il materiale sensibile
sul lato superiore, ed il riscaldatore su quello opposto.
I sensori MOSFET (Metal-Oxide-Semiconductor Field Effect Transistor)
hanno uno schema del tipo di Fig. 1.3. Il gate è costituito da un metallo
catalitico, come ad esempio palladio, iridio o platino. Le molecole di gas si
dissociano sulla superficie del gate, e gli atomi diffondono rapidamente
Capitolo 1 Introduzione
14
attraverso il metallo, sotto l’interfaccia ossido-metallo dove vengono adsorbiti.
La quantità di atomi all’interfaccia è legata alla concentrazione di gas
nell’ambiente. Tali atomi formano uno strato di specie elettricamente polarizzate.
Questo provoca l’effetto di una extra tensione applicata al gate, ∆ V. E’ quindi
necessario applicare una tensione di gate esterna più bassa per mantenere
costante la corrente di drain, e tale shift di tensione è rilevato come segnale
d’uscita del sensore. Anche i MOS non lavorano a temperatura ambiente, ed
offrono a temperature diverse, selettività e sensibilità variabili.
Figura 1.3. Schema di collegamento del MOSFET e shift della caratteristica VI.
I sensori Conductive Polymers (CP) sono basati su materiali plastici in
grado di condurre cariche quasi con la stessa capacità dei metalli. L’esposizione
di tali materiali ad alcuni tipi di gas causa una variazione della conducibilità in
modo proporzionale alla concentrazione del gas. Sono realizzati ponendo un film
sottile del polimero, con sensibilità e selettività opportune, su un substrato fornito
di contatti elettrici. Alterando il gruppo funzionale o la struttura del polimero o
sfruttando differenti drogaggi, si ottengono film polimerici, e quindi sensori per
un gran numero di composti.
Capitolo 1 Introduzione
15
1.5. Il PARC per EN
Il riconoscitore di pattern (pattern recogniser) è un modello matematico che a
partire dalle uscite dei sensori ricostruisce l’identità dei gas presenti in soluzione
gassosa, ed eventualmente le loro concentrazioni. Le tecniche di pattern
recognition sono molteplici. Tra le più diffuse troviamo: la Principal Component
Regression, la Cluster Analysis, le Artificial Neural Networks e le Self-
Organising Maps.
La Principal Component Regression (PCR), permette di ridurre la
dimensionalità dello spazio dei dati, con minima perdita di informazione nel caso
i dati abbiano una correlazione lineare. Supponiamo di avere n sensori:
probabilmente molti di questi saranno correlati tra loro, quindi lo spazio dei dati
avrà una dimensione minore di n. Applicando il metodo PCR possiamo scoprire
la direzione lungo la quale l’insieme dei dati ha il massimo della varianza, ossia
della dispersione, che viene perciò definita componente principale. La seconda
componente principale è quella perpendicolare alla prima con la varianza più
elevata. Così iterando si possono individuare tante componenti principali quanti
sono i sensori. In realtà solo poche di loro contengono informazione sul
problema, mentre le altre riportano solo rumore statistico. Proiettando i dati sulle
componenti importanti, di solito due e costruendone un diagramma cartesiano,
otteniamo la Principal Component Analysis (PCA), che permette lo studio della
maggior parte dell’informazione contenuta nell’insieme dei dati, se è vero che la
correlazione è di tipo lineare. L’analisi si è quindi spostata da uno spazio n-
dimensionale ad uno bi-dimensionale, con ovvie semplificazioni.
Nella Cluster Analysis (CA), tutte le misure da sensori sono classificate in
gruppi (cluster): misure molto vicine, ossia simili, fanno parte dello stesso
cluster. I criteri di similarità sono diversi, il più utilizzato è quello della distanza
euclidea tra i vettori di risposta dei sensori. L’uso più comune di tale metodo sta
comunque nella sola visualizzazione dei dati, per capire quanto le misure della
Capitolo 1 Introduzione
16
stessa classe siano tra loro simili e quanto le varie classi siano diverse e
riconoscibili In questa tecnica non si tenta una ottimizzazione dei parametri
disponibili allo scopo di migliorare l’abilità nella classificazione, ma si cerca solo
di rendere evidenti le proprietà che sono presenti nell’insieme di misure fatte con
i sensori. Il metodo è per tale ragione detto unsupervised.
La Self-Organising Map (SOM) è un metodo di tipo neuronale che
permette di mappare in modo non lineare, su uno spazio di dimensioni ridotte,
generalmente una o due, le misure prodotte dai sensori. Consideriamo lo spazio
dei sensori come lo spazio geometrico ottenuto componendo le uscite dei sensori
secondo assi ortogonali. La SOM è un insieme ordinato di punti nello spazio dei
sensori, organizzato a griglia (solitamente bidimensionale a maglia quadrata).
Ciascun punto della griglia è chiamato neurone e le sue coordinate nello spazio
dei sensori sono detti pesi. Ad ogni nuova misura, viene identificato il neurone
con i pesi più vicini alla misura, e i suoi pesi vengono aggiornati in modo da
diventare più simili all’ultima misura. In termini figurati il neurone si sposta
nello spazio dei sensori verso la nuova misura, di una quantità che può essere
decisa dall’operatore. Anche i pesi dei neuroni interconnessi al neurone vincente
vengono aggiornati per avere un effetto cooperativo che conduce a mapping più
fedeli della statistica delle misure dei sensori. Nelle regioni dello spazio dove
cadono molte misure, ci saranno molti neuroni, e pochi altrove. La SOM allora
risulterà rappresentata da una superficie curva disegnata nello spazio dei sensori.
L’Artificial Neural Network (ANN), è senza dubbio il metodo più usato
nel riconoscimento del pattern: è costituita da neuroni artificiali, organizzati in un
numero arbitrario di strati, generalmente tre. Il numero dei neuroni nel primo e
ultimo strato è rispettivamente uguale al numero di segnali d’ingresso e al
numero delle classi da riconoscere. Un neurone artificiale è un semplice
elemento di elaborazione che sfrutta come segnali di ingresso le uscite dei
neuroni dello strato precedente, per generare un segnale d’uscita scalare.
Tale uscita è solitamente la trasformazione di una combinazione lineare degli
ingressi attraverso una funzione di trasferimento generalmente non lineare.
Capitolo 1 Introduzione
17
Ingressi della rete
Uscite della rete
Σ
.
.
.
w
1
w
2
w
n
neurone
ingressi
uscita
Figura 1.4. Esempio di ANN a tre strati e schema del processamento effettuato da ciascun
neurone, con funzione di trasferimento non lineare del tipo f x()=
1
1 + e
− x
.
Un esempio di tale funzione di trasferimento è la funzione a gradino di
Heavyside, la quale, fornisce in uscita un valore non nullo quando il valore della
combinazione lineare è al di sopra di una certa soglia e zero altrimenti.
Solitamente viene invece usata la funzione tangente iperbolica, o sigmoide.
L’ultimo elemento da considerare è come una ANN possa essere progettata per
svolgere il riconoscimento di pattern. Ciò viene attuato attraverso un processo di
adattamento dei pesi delle varie combinazioni lineari, detto apprendimento.
Fornendo alla rete dati da odori conosciuti, si possono adattare tali parametri (ed
eventualmente altri, contenuti nella rete) al fine di ottenere l’uscita voluta, che è
codifica del riconoscimento avvenuto.