2
1.2 Scopo di questo lavoro
Questo lavoro appartiene al filone di studi tesi alla caratterizzazione del fenomeno dell’inquinamento
da ozono e in questo senso prosegue idealmente dai lavori di Filograsso e Capoccia (1998) e quello di
Maestrini (2002); allo stesso tempo ha un occhio di riguardo per la modellistica, lo studio è infatti
indirizzato a conseguire conoscenze utili allo sviluppo di modelli che simulino il comportamento di
questo inquinante e, più in generale, ad indirizzare studi per una più profonda comprensione delle sue
dinamiche spaziali.
Questa tesi si prefigge di conseguire i seguenti risultati:
ξ Definire una procedura il più possibile solida per l’analisi spettrale delle serie temporali
ambientali.
ξ Caratterizzare quanto meglio possibile l’ozono in termini di analisi spettrale.
ξ Identificare le caratteristiche di correlazione spaziale del fenomeno ozono in Lombardia al
fine di fornire indicazioni sul raggio minimo di un’area di studio il cui centro sia poco suscettibile
alle condizioni esterne all’area stessa. Un’area di studio con queste caratteristiche si presta ad
essere un dominio di calcolo su cui possono lavorare con successo i modelli concettuali di
simulazione senza imporre condizioni troppo stringenti alla precisione con cui vengono fornite le
condizioni al contorno. Il raggio dell’area sarà allora uguale o maggiore della distanza per la quale
la correlazione spaziale tipica del fenomeno (distanza di correlazione) scende al di sotto di una
soglia prefissata.
ξ Identificare gli andamenti temporali dell’ozono in Lombardia (in termini di correlazione e
periodicità) per definire l’orizzonte di tempo (orizzonte di calcolo) minimo su cui occorre
osservare gli andamenti delle concentrazioni simulate per poterne definire l’aderenza ai dati
misurati e quindi la bontà del modello e della taratura dei suoi parametri. Nel caso esistano nelle
serie misurate andamenti sinusoidali di fondo con differenti frequenze e ampiezze, occorrerebbe
una serie simulata lunga almeno 10 volte la periodicità che si intende verificare per ottenere una
solida stima della coincidenza dei due andamenti (Meko, 2003). Come per la correlazione
spaziale, anche per la correlazione temporale può essere definita una misura, il tempo di
correlazione.
In questo lavoro assumerò come soglia il valore 1/e (dove e è il numero di Nepero base dei logaritmi
naturali: 2,71…). La distanza di correlazione 1/e (e-distance) e il tempo di autocorrelazione 1/e (e-
time) sono indicatori già utilizzati da diversi autori e derivano dal National Climatic Data Center che li
ha usati per allocare le sue stazioni di rilevamento (Rao et al., 1997); in queste applicazioni 1/e viene
assunto come il limite di interesse al di sotto del quale due serie non si possono più considerare
fortemente correlate (Nota: 1/e # 0.36…). Tra gli obbiettivi del lavoro, la stesura della tesi seguirà
principalmente il terzo (stima della distanza di correlazione), conseguendo gli altri in corso d’opera.
3
1.3 Metodologia adottata
Stimare la distanza di correlazione 1/e non pare a prima vista particolarmente difficile da effettuare: si
scelgono alcune serie temporali di ozono tra quelle disponibili e, dopo alcune operazioni preliminari di
aggiustamento delle serie (dati mancanti, outlayers, ecc…), è sufficiente calcolare il coefficiente di
correlazione tra le diverse serie e riportarlo in un grafico avente come ascissa le distanze tra le stazioni
scelte, quindi si traccia una curva interpolante che segua l’andamento dei dati e si calcola la distanza
alla quale l’interpolante arriva al valore 1/e. Seguendo questa via si approda ad un risultato che può
lasciare inizialmente perplessi: la distanza di correlazione 1/e stimata risulta di circa 65000 km (Figura
0.1a) e il tempo di autocorrelazione 1/e risulta compreso tra 47 e 64 giorni secondo le serie, con media
di 56,5 (Figura 0.1b).
Figura 0.1: a) andamenti delle correlazioni tra le serie di ozono secondo la distanza tra
le stazioni e loro interpolante; b) autocorrelogrammi delle serie di lavoro e loro media.
La distanza di correlazione stimata appare assolutamente inverosimile, infatti ha scarso senso un
raggio di correlazione superiore alla semicirconferenza equatoriale terrestre (40000 km), in generale è
senz’altro un errore il tentativo di stimare una distanza molto maggiore della distanza base utilizzata
per i calcoli (le stazioni più lontane tra quelle che utilizzo per lo studio distano 250 km). Una stima più
sensata dovrebbe comunque essere tale da coprire buona parte dell’emisfero nord; infatti osservando
gli autocorrelogrammi per una maggiore estensione di passi risulta evidente la presenza di una ciclicità
(Figura 0.2a).
a) b)
4
La stessa conclusione può essere ottenuta osservando le serie sovrapposte e l’andamento della loro
media (Figura 0.2b). La ciclicità annua è tanto potente all’interno delle serie di ozono da dominare
ogni altro andamento; calcolare le correlazioni sulle serie tal quali significa quindi misurare quanto le
stagioni sono contemporanee nelle diverse stazioni, quindi la e-distance (per questa misura) dovrebbe
essere tale da coprire buona parte dell’emisfero
1
.
Figura 0.2: a) autocorrelogrammi delle serie di lavoro e loro media;
b) serie di lavoro sovrapposte e loro media
Il compito è quindi molto più arduo di quanto appaia inizialmente e porta a utilizzare un consistente
insieme di conoscenze riguardanti i metodi dell’analisi spettrale
2
.
Per ottenere la distanza di correlazione cercata è infatti indispensabile rimuovere la ciclicità annua dai
dati eliminando la sinusoide di frequenza 1/365. Tale rimozione deve ovviamente essere eseguita nel
miglior modo possibile, senza cioè perdere informazioni o disturbare le serie. Il metodo adottato per
assicurare la correttezza del taglio eseguito è frutto di questo lavoro di tesi.
Il problema della corretta rimozione della ciclicità stagionale dalle serie di dati è stato risolto in
Eskridge et al. (1997) e l’applicazione nel caso specifico dell’ozono è seguita in Rao et al. (1997). Il
suddetto metodo si basa sulla rimozione delle basse frequenze a mezzo del filtro KZ(m,k) (filtro
Kolmogorov-Zurbenko) che ha dimostrato di possedere ottime caratteristiche spettrali (Eskridge et al.,
1997). Per la corretta applicazione del metodo è necessario possedere una serie stabile: ho affrontato
questo problema nel capitolo 6 nel quale propongo una mia soluzione.
1
Se le stazioni in esame appartengono a latitudini simili la distanza di correlazione nella direzione est-ovest è
“tutta la circonferenza terrestre” che sulla latitudine di 45° misura circa 56000 km. Bisogna aggiungere che con
ogni probabilità in nessun punto di detta circonferenza la correlazione scenderà sotto il valore di soglia; un
discorso diverso andrebbe fatto per la direzione nord-sud ma esula completamente dallo scopo della tesi.
2
Per analisi spettrale si intende lo studio delle caratteristiche dello spettro (periodicità, rumore, potenze, ecc…);
per estensione viene applicato anche alle analisi successive a trattazioni in frequenza delle serie quali la
suddivisione in serie derivate per mezzo di un taglio in frequenza. Le serie derivate dal taglio possiedono lo
stesso numero di dati della serie originaria ma sono composte ciascuna da solo una porzione delle potenze
spettrali della serie originaria. Se si sommano le serie derivate si ottiene nuovamente la serie originaria.
a) b)
5
Rimossa l’oscillazione annua le serie presentano un andamento uniforme e stabile, a quel punto è
possibile calcolare le correlazioni e le altre statistiche di interesse. I risultati così ottenuti, secondo chi
scrive, possono ulteriormente essere affinati attraverso uno studio dei co-spettri; propongo questo
accorgimento nel capitolo 6.
I metodi che ho seguito e da cui ho preso spunto, descritti nelle basi teoriche e nelle applicazioni di
letteratura nei capitoli 3 e 4, sono derivati da un insieme di fonti diverse: Rao et al. (1995), Sebald et
al. (2000), Sirois et al. (1995), DiRienzo et al. (1998), DiRienzo e Zurbenko (1999), Jenkins e Watts
(1968), Hayes (1996), Efron e Tibshirani (1993).
1.4 Dati utilizzati
In questa tesi verranno utilizzati i dati di concentrazioni orarie dal 1-1-1992 al 31-12-1996 di 7
stazioni di rilevamento (situate in Lombardia o nelle sue immediate vicinanze) appartenenti a diversi
enti: regione Lombardia, ENEL, JRC. L’analisi spettrale verrà condotta solo su statistiche giornaliere
come normale in letteratura (Thompson et al., 2001), utilizzando sia il massimo giornaliero che la
massima media delle otto ore (giornaliera). Quest’ultima è stata recentemente introdotta dalla
normativa europea (Direttiva CEE, 2002), il suo utilizzo negli Stati Uniti è invece ormai consolidato.
La trattazione principale (Cap.6) verterà esclusivamente sui dati di massima media delle otto ore
mentre i grafici e i risultati riguardanti il massimo giornaliero saranno presentati in Allegato 4.
1.5 Articolazione del lavoro
Sequenza dei capitoli:
1. la presente introduzione al lavoro;
2. caratteristiche fisiche e chimiche dell’inquinamento da ozono e sue dinamiche fondamentali;
3. teoria di base sugli strumenti statistici utilizzati;
4. applicazioni di letteratura dei metodi di analisi spettrale che riguardano questa tesi e presentazione
per punti del metodo sviluppato in questo lavoro;
5. descrizione delle serie di lavoro, operazioni preliminari e breve analisi nel dominio del tempo;
6. analisi spettrale delle serie;
7. conclusioni;
Questa tesi presenta tre capitoli di stato dell’arte (cap. 2, 3 e 4), questo per suddividere in modo
organico le diverse conoscenze necessarie alla sua comprensione e che sono servite alla sua stesura.
Seguono i capitoli che contengono il lavoro svolto e i risultati ottenuti (cap. 5, 6), anche questi sono
suddivisi per separare l’ambito più comune delle operazioni preliminari e quello specifico dell’analisi
spettrale delle serie ambientali. Il capitolo successivo (cap. 7) contiene le conclusioni e i possibili
sviluppi.
Chiudono il lavoro la bibliografia e i seguenti allegati:
A) eliminazione degli outlayers e interpolazione dei dati nelle ore di manutenzione;
B) risultati del test Montecarlo per la scelta del metodo di ricostruzione dei dati mancanti;
C) stima delle soglie di significatività dei picchi spettrali;
D) risultati per le serie di massimo giornaliero;
E) procedura per l’esecuzione dell’analisi spettrale con le routines sviluppate.
6
1.6 Contributi originali
Questa è la prima tesi del Politecnico di Milano sull’analisi spettrale delle serie temporali ambientali,
ed è anche il primo studio spettrale delle serie di ozono lombardo per quanto a conoscenza di chi
scrive.
Le ricerche bibliografiche condotte per ottenere una conoscenza sufficiente della materia trattata sono
riassunte, negli aspetti fondamentali, nei capitoli 2 e 3-4 secondo gli argomenti trattati:
Ozono: ho riassunto le attuali conoscenze sull’inquinamento da ozono troposferico, comprendendo
anche gli studi internazionali più recenti. Ulteriori approfondimenti si possono trovare nei testi in
bibliografia, in particolare quelli citati nel capitolo 2 e, sopra a tutti, Poluzzi et al. (1998).
Analisi spettrale: per raggiungere lo scopo prefissato e garantirne l’affidabilità ho dovuto modificare
i metodi per eseguire l’analisi spettrale esistenti in letteratura (Cap.4) appoggiandomi alle loro basi
teoriche (Cap.3) e arrivando a sviluppare una procedura valida e applicabile a qualunque serie
ambientale.
Questa tesi rappresenta un punto di partenza, per questo ateneo, per il futuro utilizzo dell’analisi
spettrale in campo ambientale: i programmi che ho sviluppato per conseguire i risultati qui presentati
sono stati pensati per venire utilizzati come un toolbox di Matlab sull’analisi spettrale corredato di
relativo manuale teorico (Cap.3 e 4), pratico (Allegato 5) e caso di studio (Cap.5 e 6).
Per il caso specifico dell’ozono in Lombardia questa tesi:
ξ risponde alle domande iniziali fornendo la distanza e il tempo di correlazione del processo ozono
aldilà delle periodicità stagionali e climatiche (diversamente dagli studi di letteratura che
rimuovono i soli andamenti stagionali);
ξ definisce i filtri ottimi per il taglio in frequenza delle serie di ozono nella Valpadana;
ξ identifica altre periodicità climatiche non ancora rilevate dagli studi di letteratura;
ξ mostra come queste periodicità climatiche di scala sinottica possano spiegare l’andamento dei casi
di ozono (Cap.7).
Per la tecnica dell’analisi spettrale questa tesi propone:
ξ un metodo di stabilizzazione della varianza più valido di quello più comunemente utilizzato in
letteratura per trattare le serie ambientali;
ξ apre una porta ad una maggiore precisione e significatività nelle stime della distanza e del tempo
di correlazione;
ξ una procedura mista che offre maggiori capacità di adattamento alle serie studiate e quindi un
mezzo più potente per eseguire le indagini.
7
Per la modellizzazione dell’ozono, questa tesi fornisce gli strumenti per poter tarare e validare i
modelli non solo sul confronto della serie simulata con la serie misurata ma anche, e soprattutto,
attraverso le serie filtrate. Si possono separare in frequenza i diversi fenomeni:
trend Î emissioni, cambiamenti climatici ecc…;
stagionale Î periodicità stagionali e andamenti annui;
sinottico Î periodicità climatiche, andamenti settimanali, ecc…
Si possono separare in questo modo sia la serie misurata che quella simulata per poi confrontare le
coppie, di pari frequenza, e scoprire non solo quanto il modello è inesatto ma anche quale parte del
modello si allontana dalla realtà e in che modo. Sarà forse anche possibile tarare separatamente le
diverse parti del modello per inseguire i diversi fenomeni senza che altri effetti disturbino la taratura.
Questi metodi di validazione sono stati presentati in letteratura in (Biswas et al., 2001; Hogrefe et al.,
2001a; Hogrefe et al., 2001b) e questa tesi non se ne occuperà direttamente.