empirical evidence into theoretical and empirical models in
finance seems to us a genuine challenge for further research.”
Una sfida per ulteriori ricerche, che questa tesi, con assoluta modestia,
vorrebbe raccogliere.
Inoltre, gia` in tempi a noi lontani, alcuni importanti economisti ave-
vano osservato come nelle variabili macroeconomiche e finanziarie vi fos-
sero aspetti di non-linearita` o comunque di asimmetria, se persino Keynes
nel 1936 affermava nella sua opera piu` famosa che:
”...the substitution of a downward for an upward tendency
often takes place suddenly and violently, whereas there is,
as a rule, no such sharp turning point when an upward is
substituted for a downward tendency.”
Proprio in virtu` delle considerazioni sinora espresse, verteremo la nostra
attenzione essenzialmente sui modelli non-lineari parametrici nonche´sui
recenti innovativi sviluppi dovuti all’applicazione delle reti neurali arti-
ficiali (ANN).
Il presente lavoro e`cos`ı organizzato: nel primo capitolo richiameremo
i concetti di linearita` e non, esaminando alcuni test che permettono di
diagnosticarne la presenza, almeno in termini generali (riservandoci di
esaminare i test di linearita` contro specifiche alternative, dopo aver trat-
tato i modelli non-lineari ai quali si riferiscono). Nel secondo capitolo
entreremo nel vivo delle tecniche adoperabili per modellare i rendimenti
delle serie finanziarie, concentrando la nostra attenzione sui cosiddetti
modelli regime switching come il SETAR e lo STAR. La non-linearita`
in varianza ed i modelli per la volatilita`, saranno oggetto del capitolo
terzo, con particolare enfasi sulle varianti asimmetriche della classe dei
modelli GARCH, ma anche sulla possibilita` di combinare tali modelli
per l’eteroschedasticita` condizionale con variabili esogene. Con questi
argomenti si conclude la prima parte della tesi, interamente dedicata ai
modelli parametrici.
Nella seconda parte, invece, la discussione riguardera` le reti neurali artifi-
ciali (ANN), rivolgendo la nostra attenzione essenzialmente alle tipologie
di rete usate piu` di comune per modellare le serie storiche. In conclu-
sione, nella terza parte della tesi ci accingeremo a mettere in pratica le
2
tecniche esposte nei precedenti capitoli. A tal fine verranno analizza-
te 10 serie storiche rappresentative delle principali variabili economico-
finanziarie (tassi di cambio, indici azionari, materie prime, etc...) e la
nostra discussione riguardera` principalmente l’analisi comparata tra le
performance ottenute dai diversi modelli parametrici e non, tanto per i
rendimenti come per la volatilita` e sia in termini di capacita` di adatta-
mento in-sample che di previsione ex-post.
Avviandoci alla conclusione di questa introduzione, va pero` sottoli-
neato come la scelta effettuata di escludere i modelli lineari dalla pre-
sente trattazione, non deve indurre a ritenere che tale classe di modelli
sia ormai del tutto superata; anzi, essa gioca tuttora un ruolo impor-
tante almeno per due ragioni: la prima e` che, soprattutto per finalita`
esplicative piuttosto che previsive, i modelli lineari hanno una maggiore
semplicita` di utilizzo, la seconda e` che la stima di un modello lineare
richiede tempi di calcolo notevolmente piu` brevi (specie in confronto a
tecniche piu` sofisticate come le reti neurali) e cio` naturalmente li rende
preferibili per tutte quelle applicazioni dove la pronta disponibilita`diun
risultato sia la priorita`.
Lasciando per ora irrisolta la domanda che fa da titolo a questo pa-
ragrafo e prima di entrare nel vivo della tesi, ci sembra di qualche utilita`
presentare sotto forma di tabella una veloce rassegna (Galati & Taglia-
vini, 1999) su alcune indagini condotte in merito alla natura delle serie
storiche finanziarie, che suffragano quasi sempre l’ipotesi che la non-
linearita` sia una regolarita` empirica riscontrabile spesso in tali serie. Ad
analoghe conclusioni giunge anche un’altra ampia ed interessante disa-
mina condotta dai gia` citati Franses and Van Dijk (2000), autori di una
delle piu` complete monografie sulla materia.
3
Tabella 1: Alcune indagini empiriche sulla natura delle serie
storiche finanziarie.
Lavoro Serie considerate Conclusioni
Scheinkman
and LeBaron
(1989)
Indici CRSP, NYSE, Trea-
sury Bills Returns - 5200
dati a cadenza giornaliera.
Nei dati vi e` non-linearita`(in
particolare caos deterministico).
Frank, Sten-
gos (1988,
1989)
Oro e argento quotati a
Londra.
Chiare caratteristiche di non-
linearita`.
Papelli,
Sayers
(1989)
Principali valute contro
il dollaro (dati giornalie-
ri, settimanali, mensili e
trimestrali).
Esiste una dipendenza non linea-
re che potrebbe essere spiegati
con modelli stocastici GARCH
piuttosto che da una struttura
non lineare deterministica.
Peters
(1989)
SP500 dal 1950 al 1989. Nel mercato sono chiaramente
presenti tracce di legami non
lineari
Vassilicos,
Demos, and
Tata (1992)
DEM/$ - dati tick-by-tick
relativi ad una settima-
na. 20000 dati sul NY-
SE a cadenza giornaliera
(1928-1988).
Non viene riscontrata traccia di
dinamiche caotiche; Serie stori-
che non troppo lunghe (circa 600
dati) possono supportare l’ipote-
si ma serie lunghe non la avva-
lorano; I rendimenti non seguo-
no la distribuzione normale ma si
supporta una ipotesi di mercato
frattale.
Willey
(1992)
SP100 Stock Index - 1982-
88, 1769 osservazioni gior-
naliere. Nasdaq 100
1985-89, 945 oss. giorn.
Le conclusioni non sono univoche
ma suggeriscono l’assenza di forti
legami non-lineari.
(segue)
4
Lavoro Serie considerate Conclusioni
Gallo (1992) DEM/$ 1973-1989. Per fare emergere le caratteristi-
che caotiche delle serie storiche
empiriche e` essenziale la proce-
dura di pulizia dal noise; vie-
ne consigliata la procedura di fil-
traggio singular spectrum analy-
sis ; si ottengono chiari segnali di
caoticita` della serie.
Eldridge,
Berhardt,
and Mulvey
(1995)
SP500, dati tick-by-tick
relativi a 34 giorni di
negoziazione.
I dati a cadenza giornaliera non
mostrano indizi di caoticita`; I da-
ti ad alta frequenza invece indi-
cano in molti casi la presenza di
determinismo caotico.
Bianchi
(1995)
MIB 1980-1994, dati gior-
nalieri.
Le distribuzioni delle variazioni
logaritmiche non seguono la leg-
ge di Gauss ma un processo sta-
bile non normale di esponente
caratteristico variabile. La se-
rie scelta presenta dipendenza di
lungo termine statisticamente si-
gnificativa con un ciclo medio
non periodico di 1200 sedute, al
termine del quale le osservazioni
diventano casuali. Si discrimina
tra fasi stabile e caotiche; nelle
fasi stabili si riscontra una coin-
cidenza per tutti gli orizzonti di
investimento; nelle fasi caotiche
si riscontra un rischio crescente
per orizzonti di investimento piu`
pronunciati.
Chinetti,
Conti, and
Rossignoli
(1996)
Cambi contro lire 1972-
1993, dati giornalieri.
Vi sono fenomeni di persisten-
za degli andamenti; In particola-
re il cambio dollaro-lira presenta
caratteristiche non lineari.
5
Parte I
Modelli parametrici
non-lineari
Capitolo 1
Linearita` e non linearita`
Visto che il presente lavoro si occupera` specificatamente di modelli non
lineari, incominciamo chiarendo i concetti di linearita` e non linearita`
(tale definizione e` tratta da Pellizzari (2001) che a sua volta rimanda a
Piccolo (1990)).
Diciamo che un processo X
t
e` lineare quando ammette una decomposi-
zione bidirezionale del tipo:
X
t
=
∞
∑
i=−∞
a
t
t−i
(1.1)
dove
t
rappresenta il cd. White Noise (Rumor Bianco).PerWhite
Noise intendiamo una successione di variabili casuali indipendenti ed
identicamente distribute (i.i.d.).
Se poi la distribuzione delle v.c. e` quella normale, si parla di White
Noise Gaussiano. In questo, e solo in questo caso, l’indipendenza coin-
cide con l’incorrelazione, ovvero con la mancanza di legami lineari.
Il processo WN, che e`ilpi`u semplice trai processi stazionari, e` costituito
da una successione di v.c. di media zero, omoschedastiche ed incorrelate.
• E(
t
)=0 ∀t
• Var(
t
)=E(
t
)
2
= σ
2
<∞∀t
• Cov(
t
,
t−k
)=E(
t
t−k
)=γ(k)=0 ∀k =0
7
In particolare i modelli lineari presenti in letteratura restringono la lo-
ro attenzione sui processi con varianza finita e tali da ammettere la
rappresentazione monodirezionale che segue:
y
t
=
∞
∑
i=0
a
i
t−i
(1.2)
I modelli ARMA sono assunti a paradigma della linearita`perch´esono
una rappresentazione finita ed efficiente della 1.2. Diremo che y
t
e`un
processo ARMA(p,q) (Autoregressive Moving Average) se:
y
t
=
p
∑
i=1
a
i
y
t−i
+
q
∑
j=1
b
j
t−j
+
t
(1.3)
I processi lineari sono indubbiamente tra i piu` diffusi ed alla base di
tutta la trattazione delle serie storiche stazionarie, grazie al fondamentale
risultato a cui perviene il teorema di Wold, che di seguito definiamo non
prima di aver definito pero` il concetto di stazionarieta`:
DEFINIZIONE 1 (Stazionarieta`) Un processo y
t
si dice stazionario
(in senso debole) se:
• E(y
t
)=µ ∀t
• E(y
t
− µ)
2
= σ
2
<∞∀t
• E(y
t
− µ)(y
t−k
− µ)=γ(k)
TEOREMA 1 (Teorema di Wold) Ogni processo stazionario y
t
di
media µ si puo` decomporre univocamente in
y
t
= w
t
+ v
t
(1.4)
dove
w
t
=
∞
∑
j=0
ψ
j
a
t−j
,ψ
0
=1,
∞
∑
j=1
ψ
j
< +∞ (1.5)
8
vt
= µ+
∞
∑
j=1
(α
j
sin (λ
j
t)+β
j
cos (λ
j
t)) (1.6)
e le successioni di variabili casuali { a
i
}, { α
j
} e { β
j
} sono incorrelate,
omoschedastiche e di media nulla.
Dal teorema di Wold risulta che ogni processo stazionario puo` essere
scomposto in due componenti analizzabili disgiuntamente, poiche´incor-
relate. La prima w
t
e` detta componente non deterministica (o puramente
stocastica o processo lineare) ed e` una combinazione lineare di infiniti
processi WN, mentre la seconda v
t
e` detta componente deterministica
perche´e` una combinazione lineare infinita di onde periodiche con am-
piezza (α
j
e β
j
)efase(λ
t
) che sono s`ı v.c. ma la cui frequenza angolare
e` deterministica. Pertanto, assumendo per semplicita` che la parte de-
terministica periodica v
t
sia nulla, il teorema di Wold mostra che ogni
processo stazionario e` approssimabile con modelli lineari.
Lo stesso enunciato del teorema pone in evidenza pero`qualee`ilproble-
ma principale: le variabili a
t
sono incorrelate ma non indipendenti. Per
chiarire l’importanza della dicotomia indipendenza-incorrelazione (ricor-
dando che l’incorrelazione consiste esclusivamente nella la mancanza di
legami lineari) e` bene fare alcune considerazioni. Lo scopo di ogni model-
lo, infatti, e` quello di produrre residui indipendenti, estraendo cos`ı tutto
il contenuto informativo presente nei dati. La semplice incorrelazione dei
residui non assicura che la struttura dei dati sia stata colta dal modello,
poiche´ potrebbero essere presenti anche dei legami non-lineari. E’ evi-
dente quindi che l’uso di modelli lineari finiti per una serie stazionaria
potrebbe non essere adeguato pur producendo residui incorrelati. Questi
infatti potrebbero essere molto lontani dall’indipendenza e cio` giustifica
anche la grande enfasi posta da Box and Jenkins (1970) sulla verifica
dell’ipotesi di indipendenza dei residui.
Inoltre appare evidente anche a livello intuitivo, che un modello del tipo
y
t
= f(y
t−1
,y
t−2
, ...,
t−1
,
t−2
, ...;
t
) (1.7)
lascia aperto un piu` ampio panorama di possibilita`. Come abbiamo
detto, lo scopo di ogni modello e` quello di cogliere quanto piu` puo`del
contenuto informativo di una serie di dati e lo sforzo della modellisti-
ca non lineare va proprio in questa direzione: spiegare quei legami non
9
lineari che, chiaramente, una classe di modelli come ad esempio quella
ARMA non e` in grado di fare. A tutto cio` si aggiunga che una mole sem-
pre crescente di studi empirici (vedi tabella a pag. 4) conferma l’ipotesi
che numerose serie storiche economiche ed in particolare le serie storiche
finanziarie non siano interpretabili alla luce dei modelli lineari (specie
per quanto riguarda la componente della volatilita`, che solitamente non
e` stazionaria. Si parla al riguardo di eteroschedasticita`).
Volendo effettuare una classificazione dei modelli non lineari (che
come tutte le classificazioni e` un po’ semplicistica) possiamo dividere tale
modellistica in due categorie principali, che saranno oggetto dei capitoli
seguenti:
• Modelli che spiegano la non linearita`inmedia
• Modelli che spiegano la non linearita` in varianza.
Fra i primi possiamo elencare, ad esempio, i modelli autoregressivi
non lineari (NLAR, NonLinear AutoRegressive (Jones, 1987)), i modelli
a soglia (SETAR, Self-Exciting Threshold AutoRegressive (Tong & Lim,
1980)), gli autoregressivi esponenziali (EXPAR, EXPonential AutoRe-
gressive(Ozaki, 1982)).
Fra i secondi, i modelli Auto Regressive Conditionally Heteroscedasticity
(ARCH) di Engle (1982), Generalized ARCH (GARCH) di Bollerslev
(1986), Threshold GARCH (Glosten, Jagannathan, & Runkle, 1993),
Exponential GARCH (Nelson, 1991) ed altri ancora.
I modelli relativi alla non linearita` in media si adattano bene a mo-
dellare i redimenti delle serie finanziarie, mentre quelli che spiegano la
nonlinerita` in varianza sono chiaramente piu` adatti per modellare la
volatilita`.
1.1 Test di linearita`
Alla luce di quando detto finora, appare chiaro come il primo passo da
compiere nel tentativo di specificare il modello sottostante ad una serie
di dati, sia quello di effettuare un test di linearita`(eci`o puo` anche
essere fatto, dopo aver stimato il modello, sulla serie dei residui per
capire quanto il modello adottato colga l’essenza del fenomeno). Infatti
10
sarebbe inutile complicare le cose, qualora un semplice modello lineare
si rivelasse sufficiente a spiegare i dati.
In letteratura vi sono diversi test al riguardo, che a titolo esemplificativo
possiamo classificare nelle seguenti categorie (Tera¨svirta, Tjøstheim, &
Granger, 1994):
• Test contro alternativa specifica.
• Test senza alternativa specifica.
• Test basati sulle reti neurali artificiali (ANN).
Nel caso dei test contro un’ alternativa specifica, qualora l’ipotesi
nulla di linearita` venisse rifiutata, il test ci informa sulla specifica natura
non-lineare dei dati. Ma quello che potrebbe sembrare un vantaggio e`
anche il limite principale di questo genere di test, poiche´nonsempree`
facile determinare a priori la natura della presunta non linearita` della
serie in esame.
Proprio perche´ questi test pongono la linearita`inalternativaaunmo-
dello non-lineare specifico, ciascuno di essi verra esaminato nei capitoli
successivi dopo che avremo introdotto il modello al quale si riferisce.
I test basati sulle reti neurali artificiali (ANN) tra cui annoveriamo quelli
sviluppati da Tera¨svirta, Lin, and Granger (1993) ed da Lee, White, and
Granger (1993) verranno esaminati, invece, nella parte seconda della te-
si, quando ci occuperemo piu` in dettaglio delle reti neurali.
Ci occuperemo ora della seconda categoria di test.
1.2 Test di linearita` senza alternativa specifica
Tali test non pongono come alternativa una ben determinata ipotesi di
non-linearita`, ma vanno intesi come test sulla non-linearita` in generale.
In questa sede esamineremo il test BDS(Brock, Dechert, & Scheinkman,
1987) ed il test RESET di Ramsey (1969).
1.2.1 Test BDS
Il test BDS (Brock et al., 1987), che e` un test non parametrico, e` uno
dei piu` importanti ed efficienti di questa categoria. Inizialmente tale test
11
fu sviluppato contro l’ipotesi alternativa di un processo caotico deter-
ministico, ma poi e` stato riscontrato come esso sia potente anche nell’
individuare processi stocastici non-lineari in genere, sia in media che in
varianza (ricordiamo che i sistemi caotici sono un caso particolare di mo-
dellistica non-lineare). Questa generalita`, che costituisce uno dei pregi
principali del test, e` ovviamente anche un limite: sebbene il test BDS
possa evidenziare la presenza di una struttura non-lineare in numerosi
casi, non puo` mai identificarne l’esatta natura.
Consideriamo il processo univariatato {y
t
},pert =1,...,n;datale
processo deriviamo i seguenti vettori:
y
m
t
= {y
t
,y
t+1
,...,y
t+m−1
}
′
che sono detti m-histories o m-patterns dell’ osservazione t-esima, e rap-
presentano semplicemente m osservazioni consecutive ad y
t
. Per un dato
numero n di osservazioni, possono essere costruite n
m
= n −m + 1 dif-
ferenti m-histories.
La statistica BDS considera la dispersione dei punti della serie in spazi di
dimensione sempre crescente e la confronta con la dispersione dei punti
di un processo stocastico. La figura 1.1 costituisce una esemplificazione
grafica di questo concetto.
Il punto di partenza del test BDS, e` il calcolo del c.d. integrale di
correlazione,chee` dato da:
C
m,n
(ε)=
nm
∑
t=1
t−1
∑
s=1
I
ε
(y
m
t
,y
m
s
)/
n
m
(n
m
− 1)
2
dove I
ε
(y
m
t
,y
m
s
)e` una funzione cos`ı definita:
I
ε
(y
m
t
,y
m
s
)=
{
1se‖y
m
t
− y
m
s
‖<ε
0altrove
con la simbolistica ‖a−b‖ si vuole significare che ‖a−b‖=max
i
{|a
i
− b
i
|}
cioe` la distanza massima (o sup-norma) trai due vettori. Di conseguen-
za, I
ε
(y
m
t
,y
m
s
)e` uguale ad uno, se e solo se, la sup-norma tra le due
m-histories y
m
t
e y
m
s
e`minorediε.
12