6
costruzione di modelli simulati anche in questa branca della
Geostatistica, poiché in letteratura esistono studi del genere solo per le
FAI-0 (Funzioni Aleatorie Intrinseche di ordine 0). Prendendo spunto
dalla Simulazione Sequenziale Gaussiana, sperimentata nel caso
stazionario, si è cercato di verificare se questa tecnica sia adattabile
anche all’ambito delle FAI-k, confermando così la sua validità teorica
e realizzazione pratica. Seguendo le indicazioni fornite dagli autori di
articoli sulla simulazione sequenziale nel caso stazionario (vedi
bibliografia) e sperimentando tale tecnica nelle FAI-k, è stato
implementato un programma di calcolo in grado di eseguire una
Simulazione Sequenziale Autoregressiva per Funzioni Aleatorie
Intrinseche fino al grado k=2. Per la verifica dei risultati è stato
realizzato un altro programma di calcolo, il quale permette un’analisi
rapida dei risultati per il controllo della congruenza dei dati di
partenza con i modelli simulati.
Il secondo obiettivo della tesi è quello di studiare un inquinante
naturale, il Radon in aria sul territorio dell’Emilia-Romagna, sia con le
tradizionali tecniche Geostatistiche, sia con la tecnica dei modelli
simulati costruiti mediante l’uso della Simulazione Sequenziale
Autoregressiva di FAI-k. Lo scopo dello studio mediante l’uso della
Geostatistica “tradizionale” è quello di stabilire se esistono delle
correlazioni spaziali tra le misure eseguite all’interno delle scuole.
Grazie a tali risultati si è in grado di stabilire se le cause possono
attribuirsi solo a fenomeni aleatori (es. diversa ventilazione dei locali)
o anche a fenomeni più concreti, quali il tipo di suolo su cui sorge la
scuola (o l’edificio) o altre strutture geologiche. L’applicazione dei
modelli simulati consente di ricostruire la variabilità connessa
all’incertezza della misura, rendendo possibile l’individuazione di aree
con maggior probabilità di rischio.
7
Capitolo 1
Richiami sulla teoria delle F.A.I.-k
1.1 Introduzione
Lo studio di variabili note solo in pochi punti dello spazio è un
problema che interessa tutte quelle discipline dove l’informazione su
una variabile è inaccessibile o costosa, per cui le misure/informazioni
sono molto limitate. Il problema di riuscire a ricavare più dettagli
possibili dai dati a disposizione non è banale, ed ha da sempre
appassionato numerosi studiosi. La Geostatistica Lineare riesce a
risolvere in modo soddisfacente un’ampia classe di problemi.
1.2 Variabili Regionalizzate e Funzioni Aleatorie
Un fenomeno naturale distribuito nello spazio è caratterizzato da una
distribuzione spaziale di un certo numero di quantità misurabili
chiamate Variabili Regionalizzate. (es.: tenore di un minerale nel
sottosuolo, temperatura dell’aria in una stanza, ecc.). Per funzioni
Aleatorie intendiamo un set di variabili casuali Z(x
i
) definite in ogni
punto dello spazio in esame D: ⊥ Zx x D
i
(), . La Variabile
Regionalizzata z(x) è intesa come una particolare realizzazione di una
Funzione Aleatoria Z(x). Lo studio della Funzione Aleatoria a partire
da una sola realizzazione (quella che conosciamo in pochi punti dello
spazio) non è possibile, ma introducendo le ipotesi di stazionarietà e di
ergodicità è possibile superare i problemi derivanti dall’unicità della
realizzazione.
8
1.3 Funzioni Aleatorie Stazionarie
Una sottoclasse delle Funzioni Aleatorie sono le Funzioni Aleatorie
Stazionarie, le quali godono della proprietà per cui la legge spaziale
del processo è invariante per traslazione; l’ipotesi ergodica prevede le
medie spaziali, calcolate su domini sempre più grandi e tendenti verso
le speranze matematiche corrispondenti. Quindi in pratica ci
limiteremo allo studio di funzioni aleatorie stazionarie di ordine 2,
cioè devono esistere e non dipendere dalle coordinate:
> ≅
> ≅
EZx m
EZxZx h m Ch
xR
()
()( ) ()
2
La stazionarietà della covarianza implica la stazionarietà degli altri
due momenti secondi: la varianza ed il variogramma.
> ≅> ≅
≅
Var Zx E Zx m C
hEZxhZx CCh
()) (() ) ()
() ( ( ) ()) () ()
2
2
0
1
2
0 ϑ
Tali grandezze devono esistere ed essere finite.
1.3.1 Il variogramma
Non conoscendo il valore di z in modo continuo nello spazio occorre
calcolare un variogramma sperimentale a partire dai dati noti
utilizzando la formula valida nel caso discreto:
> ≅ ϑ
*
() ( ) ( )h
N
Zx h Zx
ii
i
N
ƒ
1
2
2
1
che verrà modellizzato cercando di interpolare i punti sperimentali con
combinazioni di modelli elementari di variogrammi.
I modelli più comunemente usati sono: pepitico, lineare, sferico,
esponenziale.
9
In tabella sono riportate le caratteristiche dei singoli modelli.
Modello Espressione Condizioni
Pepitico
ϑ Γ() ()h C h
0
Γ()
,
.
h
h
h
ζ
↑
→
↓
↵
00
10
Lineare
ϑ()h C h
1
Sferico
ϑ
ϑ
()
()
hC
h
a
h
a
hCs
s
♣
♥
♦
•
≠
÷
3
2
1
2
3
3
!
ha
ha
a: range
Esponenziale
ϑ() ( )hC e
e
h
a
1
Distanza h
ϑ
Distanza h
ϑ
Modello pepitico
Modello lineare
Fig. 1.1: Andamenti dei due modelli Pepitico e Lineare
10
Distanza h
ϑ
Modello sferico
Distanza h
ϑ
Modello esponenziale
Fig. 1.2: Andamenti del modello Sferico e modello Esponenziale
Distanza h
ϑ
Modello sferico+pepitico + lineare
Distanza h
ϑ
Modello pepitico+esponenziale
Fig. 1.3: Possibili strutture “imbricate”
11
Distanza h
ϑ
Fig. 1.4: Un esempio di modellizzazione: occorre trovare un modello
congruente e consistente con i dati sperimentali. Il variogramma
teorico può discostarsi dal variogramma sperimentale perché esso è
una stima della varianza teorica degli accrescimenti.
L’andamento del variogramma riflette il grado di correlazione fra i
punti in funzione della distanza. Quando, superato il range “a”, il
variogramma raggiunge il valore limite (Sill), esso corrisponde alla
varianza della popolazione dei punti. Diversamente dalla funzione
covarianza non tutti i variogrammi raggiungono un valore limite. La
relazione che esiste fra covarianza e variogrammi vale:
ϑ() () ()h C C h 0
C h():funzione covarianza
C():0 funzione covarianza per h=0, cioè Var[Z(x)].
1.3.2 Anisotropie
Come precedentemente ricordato, h è un vettore per cui il
variogramma può essere studiato anche in funzione della direzione
oltre che alla sola distanza. Generalmente le anisotropie si distinguono
in zonale e geometrica.
L’anisotropia geometrica si ha quando i variogrammi hanno lo stesso
sill in tutte le direzioni ma differenti range oppure, se illimitati, hanno
diversi coefficienti angolari.
12
Invece nell’anisotropia zonale il variogramma è la somma di due
variogrammi, uno di base ed il secondo che dipende dalla direzione
(es.: ϑ ϑ ϑ Μ() () ( cos )hhh
i
i
z
ξ ƒ ).
1.4 Le F.A.I.-k
Il variogramma è uno strumento che ci consente di svincolarci dallo
studio della Z(x) proponendo lo studio dei suoi accrescimenti in
funzione della distanza. Sotto le ipotesi di stazionarietà di ordine 2
abbiamo:
> ≅
≅
EZx h Zx mx m
EZx h Zx xx h h
( ) () ()
(( ) ()) (, ) ()
2
2ϑ ϑ
Queste sono delle ipotesi “forti” che, se da un lato ci consentono di
superare tutta una serie di problemi, dall’altro riducono i campi di
applicazione di queste metodologie. Esaminiamo, ad esempio, il piano
di una faglia inclinata o il profilo di un reservoir: in entrambi i casi la
media delle variabili “z” non è costante ma varia in funzione della
posizione, ovvero è osservabile una certa deriva o Trend. In oltre
esistono casi in cui il “Trend” dipende dalla Scala con cui osservo la
mia variabile; infatti fenomeni stazionari a “grande scala” non lo sono
a “piccola scala” e viceversa. Con le FAI-k (Funzioni Aleatorie
Intrinseche di ordine k) è possibile risolvere anche questi problemi
“filtrando” le derive attraverso superfici piane o quadriche che ci
riportano allo studio di incrementi stazionari. Il tipo di superficie
scelta viene indicato con k: k=0 indica un piano orizzontale, k=1 un
piano inclinato, k=2 una superficie quadrica e così via; nella pratica
corrente non si supera il grado 2.
13
1.4.1 Gli incrementi di ordine k
Un incremento generalizzato di ordine k (IG-k) è una combinazione
lineare
ZZx
ii
i
n
() ( ) Ο Ο
ƒ
1
in cui Ο è un misura autorizzata di ordine k.
Una misura Ο che attribuisce dei pesi Ο
i
a punti dello spazio a “n”
dimensioni R
n
è detta “autorizzata all’ordine k” se annulla i polinomi
di grado minore o uguale a k:
Ο
ii
k
x ƒ 0 l=0,k.
Una funzione aleatoria Z(x) si dice “intrinseca di ordine k” se per ogni
misura autorizzata Ο, la funzione aleatoria
Zx Zx x
ii
i
Ο
Ο() ( ) ƒ
è debolmente stazionaria in x R
n
ed ha media nulla, cioè:
> ≅
> ≅
EZ x
EZ x K
Ο
Ο
Ο
()
() ()
0
2
x R
n
(k () Ο: covarianza generalizzata)
Le FAI-k godono delle seguenti proprietà:
ξ se la proprietà intrinseca è vera all’ordine k, allora è vera anche
all’ordine k
1
>k, cioè una FAI-k è anche una FAI-(k+1)
ξ una FAI soddisfa la relazione > ≅EZ x
Ο
2
() φ Ο
14
1.4.2 Le Covarianze Generalizzate
Nel caso stazionario la funzione di autocorrelazione spaziale è il
variogramma, mentre per le F.A.I.-k è appunto la funzione Covarianza
Generalizzata, definita come:
> ≅KEZx() () Ο
Ο
2
Rispetto al caso stazionario, i pesi delle combinazioni lineari devono
essere “autorizzati”. In generale la funzione
kh b h
p
p
k
p
p
() ( )
ƒ1
1
0
21
è un modello di covarianza generalizzata di ordine k, sotto certi
vincoli per i coefficienti b
p
. Le covarianze Generalizzate esprimibili
sotto quella forma sono dette C.G. Polinomiali. Rispetto al caso
stazionario è bene mettere in evidenza che questi modelli sono isotropi
in quanto dipendono dal modulo di h e non dal vettore.
( hhhh hhhh
1
2
2
2
3
2
123
r
(, ,))
In tabella sono riportati i modelli di covarianza generalizzata più
comunemente impiegati:
Grado k Covarianza Generalizzata
0
K h C bh()
00
Γ
1,2
kh C bh bh bh h
o s
() ln()
01
32
Γ
vincoli:
in R
1
: Cbbb b
s001 01
000
24
τ τ τ τ ,,,
Σ
in R
2
: Cbbb b
s001 01
000
3
2
τ τ τ τ ,,,
15
in R
3
: Cbbb
bb
s001
01
000
8
3
τ τ τ τ ,,,
Σ
K(h)
K(h)
K(h)
K(h)
h
h
h
h
Lineare Cubico
Pepitico
Spline
Fig. 1.5: I modelli di Covarianza Generalizzata impiegati nella
pratica
16
1.4.3 Determinazione del grado K
Per determinare il tipo di superficie che meglio si adatta al fenomeno
studiato si stima un punto conosciuto a partire dagli altri n-1 punti per
diverse ipotesi di grado k (in genere 0, 1, 2) e si ripete questa
operazione per tutti i punti noti. Conoscendo l’errore che si commette
ogni volta è possibile stabilire la superficie che meglio interpola il set
di punti dati. In pratica si interpolano un set di 15-20 punti con la
superficie in esame, aggiustandola con il metodo dei minimi quadrati
che, si dimostra, sono una misura autorizzata di ordine k; l’errore
commesso sarà la differenza tra valore noto e valore assunto dalla
superficie polinomiale considerata. Questo tipo di operazione è
influenzato notevolmente dalla scala di lavoro. Studiare la variabile
sull’intera superficie da cui provengono i dati significa cercare una
deriva di tipo globale, mentre limitarsi ad aree più piccole significa
osservare in dettaglio la variabilità spaziale del fenomeno. Occorre
fare quindi molta attenzione per non attribuire a un trend locale un
trend di carattere generale e viceversa. La figura 1.6 illustra questo
concetto.
17
K=2
K=1
K=1
Fig. 1.6
Nei rettangoli di figura 1.6 sono messi in evidenza i trend a piccola
scala, mentre dalla visione d’insieme si può ben notare il trend
generale di ciascuno degli esempi riportati. La scelta della scala di
lavoro è un passaggio delicato che condizionerà tutte le successive
operazioni, quali la stima della covarianza generalizzata nonché la fase
di stima vera e propria. Occorre quindi prestare la massima attenzione
agli obiettivi che sono stati posti e a non perdere di vista il fenomeno
fisico che si sta studiando. Ad esempio la quota di una superficie
riferita al s.l.m. potrà anche essere negativa, se effettivamente ci
troviamo in una zona geografica in “depressione”. Invece se si sta
studiando una grandezza definita positiva, ad esempio una
concentrazione o uno spessore di una formazione, dal punto di vista
matematico delle FAI-k esse possono anche risultare negative; infatti
nessuna condizione di positività era stata posta a livello teorico, ed è
18
per questo che non si deve perdere il contatto con il fenomeno fisico
che si sta studiando.
1.4.5 Stima dei coefficienti della C.G.
Come nel caso stazionario, si ipotizza che la covarianza possa essere
considerata come la somma di modelli elementari:
Kh bK h
pp
p
() () ƒ
ovvero, utilizzando la notazione sintetica
> ≅kh Kx x EZ() ( ) () ƒ ƒ
∆
∆ Ε ∆ Ε
Ε
Ο Ο Ο
2
con Ο misura autorizzata che attribuisce dei pesi Ο
∆
ai punti x
∆
in cui si
conosce il dato. Uguagliando si ottiene quindi:
> ≅EZ k bK
pp
() () ()Ο Ο Ο
2
ƒ
che in realtà non è che una regressione lineare di > ≅Z() Ο
2
sulle variabili
K
p
() Ο. Costruendo una serie di misure Ο autorizzate all’ordine k, è
possibile determinare il numero dei modelli e quindi i coefficienti b
p
,
che soddisfano le condizioni sui vincoli sopra menzionati (vedi tabella
1.1).
19
1.5 Il Krigaggio
Noti quindi il grado k e il modello di covarianza generalizzata K(h)
oppure il variogramma per il caso stazionario, possiamo stimare in
punti non noti del nostro campo di lavoro il valore della variabile,
imponendo le seguenti importanti condizioni:
ξ che l’errore di stima sia mediamente nullo (per evitare sovrastime o
sottostime), ovvero che lo stimatore sia “corretto”.
ξ che l’errore sia il più piccolo possibile, ovvero che lo stimatore sia
“efficiente”.
ξ che la stima di un punto noto restituisca il valore noto, cioè che lo
stimatore sia “esatto”.
Il nostro stimatore è una combinazione lineare dei punti noti:
ZZ
n
0
1
*
ƒ Ο
∆
∆
∆
con n= numero di punti noti. Servono quindi n equazioni per
determinare i pesi necessari alla stima.
1.5.1 Il krigaggio di F.A.St.
Avendo a disposizione un modello teorico di variogramma, ottenuto
interpolando il variogramma sperimentale dei dati veri con i modelli
teorici più comuni (vedi 1.3), richiedendo che l’errore commesso sia
nullo e minimo (vedi 1.5), si possono imporre tante condizioni su pesi
quanti sono i dati a disposizione per la stima rendendo così possibile
la loro determinazione analitica.
La prima equazione deriva dalla prima condizione imposta (di errore
nullo):
20
> ≅EZ Z
mm
n
n
00
1
1
0
0
1
*
ƒ
ƒ
Ο
Ο
∆
∆
∆
∆
La condizione di errore minimo si ottiene minimizzando la varianza
dell’errore di stima:
> ≅
EZ Z x x x x
nn
ƒ ƒ
*
() ()
0
2
0
11
2 Ο ϑ Ο Ο ϑ
∆ ∆ ∆ Ε ∆ Ε
Ε ∆
pervenendo al sistema di Krige:
Ο ϑ Π ϑ ∆
Ο
Ε ∆ Ε ∆
∆
∆
() (); ,xx xx n
n
↑
→
°
°
↓
°
°
ƒ
ƒ
0
1
1
La varianza di stima diventa:
ς Ο ϑ Π
∆ ∆k
xx
2
0
ƒ
()