10
Capitolo 1 : Modelli univariati per la previsione dei rendimenti
Il primo passo per l’analisi di un’attività finanziaria non è necessariamente basato sullo studio della serie
storica dei suoi prezzi. I prezzi dei titoli finanziari sono difficilmente confrontabili e secondo alcune
conclusioni teoriche le loro serie sono non stazionarie,
8
in virtù di diverse ipotesi tra cui quella di efficienza
dei mercati borsistici
9
. Queste considerazioni assumono che il processo generatore dei prezzi sia
classificabile come random walk, come fece notare Mandelbrot, è che quindi ogni informazione risulti
immediatamente incorporata nei prezzi stessi.
Se invece ci si sofferma a comprendere il processo che genera i rendimenti, ci si può orientare verso lo
studio dei log – rendimenti delle serie storiche ed a modelli che includono le ipotesi di stazionarietà sotto
determinate condizioni.
I rendimenti percentuali delle serie storiche aggiustate per i dividendi distribuiti, sono definiti dalla
seguente espressione:
(1.1) = 100 log
− 1
= 100 (log − log − 1
)
dove definisce il prezzo al tempo t della generica attività finanziaria. Il log-rendimento è
un’approssimazione semplificatrice molto utile perché gode di diversi vantaggi inerenti alla riduzione della
complessità di calcolo computazionale.
Oltre a queste descrizioni ipotetiche è possibile comunque determinare un processo generatore per queste
grandezze, che si sviluppa dall’intenso lavoro svolto nel tempo dallo studio teorico riguardante le varie
distribuzioni seriali, da cui si è giunti ad accumunare diverse regolarità empiriche a queste serie.
Una prima caratteristica di spiccata importanza, soprattutto per l’applicabilità dei modelli ad
eteroschedasticità condizionale, è l’esistenza del fenomeno definito come volatility clustering (volatilità in
grappoli). Il fenomeno è descritto dal Verbeek (2006): “shock (residui) elevati tendono ad essere seguiti da
shock elevati in entrambe le direzioni, e shock contenuti tendono a sentarsi subito dopo shock contenuti”.
Questa identificazione, che nella teoria quantitativa evolve dalla forte dipendenza dei vari shock seriali,
permette di determinare un legame tra i residui al quadrato della serie, indicando la possibilità d’uso di un
modello a varianza condizionata. Questo processo della volatilità è supposto formarsi nel mercato a causa
del comportamento degli operatori finanziari, che assorbendo la notizia in momenti diversi, si trovano ad
8 M. Verbeek, Econometria, (2006)
9 E. Fama, Efficient Capital Markets, The journal of Finance, (1991)
11
operare in momenti temporali divergenti. Se consideriamo come esempio il mercato finanziario telematico
internazionale, ci è facile presumere un leggero ritardo nel recepimento delle notizie tra gli investitori con
diverso fuso orario e quindi un frazionamento della loro operatività nel tempo.
E’anche individuata l’esistenza di una correlazione positiva tra le volatilità di attività finanziarie provenienti
dallo stesso mercato, facendo presumere l’influenza di determinati fattori latenti su queste variazioni. Si
evince dal lavoro di Fama e French
10
, che fattori nascosti relativi al mercato dei titoli di stato sono in grado
di influenzare i mercati azionari domestici, avendo così la conseguenza di alterare la volatilità dei medesimi.
Tornando nuovamente sulle caratteristiche proprie dei rendimenti, è possibile sottolineare una non
significatività nell’autocorrelazione dei primi ritardi, se non consideriamo intervalli temporali molto brevi
11
.
Quest’indicazione fa presumere l’efficienza dei mercati, e fa corrispondere tutta l’informazione all’ultimo
prezzo osservato; da questo si evince chiaramente che non è possibile prevedere l’esatta grandezza dello
shock futuro partendo da quello passato.
Le evidenze empiriche hanno mostrato una correlazione positiva tra le quantità scambiate e la dimensione
della volatilità, questo fenomeno è trattato in maniera approfondita da G. Andersen
12
.
Si mostra anche che alcuni risultati in letteratura hanno individuato nella distribuzione dei rendimenti due
caratteri ricorrenti: asimmetria negativa e leptocurtosi.
L’asimmetria negativa è facilmente visibile in relazione alla presenza di elevati shock negativi ricorsivi nelle
serie storiche, e che quindi rendono presumibile una non normalità della distribuzione non condizionata.
Anche la leptocurtosi, o eccesso di curtosi, fa presumere la non normalità delle serie finanziarie, e può
essere spiegata dalla dottrina che cerca di determinare la ragione economica di questa connotazione;
questa motiva, avvalendo la proposta che i vari operatori percepiscano diversamente le aspettative future
di perdita rispetto a quelle di guadagno, il realizzarsi di scenari fortemente negativi in occasione di eventi
imprevedibili di forte interesse economico. Per un lavoro più specifico sull’analisi dell’asimmetria si può
considerare Pierò (1999), Hong e Stein (1999), e ancora Chen (2000),.
Tra i caratteri connotativi empirici delle serie, si sono denotati i fenomeni definiti: “effetto dimensione”
13
,
“l’effetto gennaio”
14
e “l’effetto fine settimana”
15
.
10 E. Fama, K. French, Common risk factors in the returns on stocks and bonds, Journal of financial
economics, (1993)
11 A. Bertazzo, Studio dell’asimmetria delle distribuzioni dei rendimenti finanziari, (2005)
12 G. Andersen, Return Volatility and Trading Volume: An Information Flow Interpretation of Stochastic
Volatility, Journal of finance, (1996)
13 Banz, “The relationship between return and market value of common stock”, Journal of finance, (1981)
14 Keim, Donald B., “Size related anomalies and stock return seasonality further empirical evidence”,
Journal of financial economics (1983)
12
L’effetto dimensionale è riscontrato da Banz (1981) sia in termini statistici sia in termini di rilevanza
empirica. Nel suo lavoro di analisi, svoltosi sul mercato USA riguardante i profitti differenziali annuali tra
l’investimento in aziende di modeste dimensioni rispetto a quelle di grande dimensioni, si evince un divario
del 19,8% tra le medesime. Questo divario di rendimento però sembra essere discontinuo nei vari periodi
storici. L’effetto gennaio si è definito proprio nell’analisi del extrarendimento delle “small cap”, fornito da
Keim(1983), dove viene illustrato che queste società sarebbero in grado di garantire metà del differenziale
di rendita proprio nel primo mese dell’anno.
L”effetto fine settimana”, riscontrato da Gabbi (1999), ci dichiara che l’aumento della volatilità alla
riapertura settimanale dei mercati è caratteristico nei momenti successivi alla riapertura del mercato di
scambio degli asset mobiliari. Infatti, secondo sue parole, “l’effetto non trading period sembra
direttamente correlato all’accumulo di informazioni che avviene quando i mercati cono chiusi e che riflette
immediatamente la sua apertura; esiste inoltre una differente volatilità osservabile sulle rilevazioni
infragiornaliere”.
L’ultimo effetto, ma non il meno importate, è l”effetto leva” (leverage effect) che ci informa su come sia
presunta l’eteroschedasticità delle serie. Va infatti ripetuto che fasi di mercato crescenti per i rendimenti
sono accompagnate da relative volatilità inferiori, creando una vischiosità dei corsi rialzisti Schwert (1989).
Questa condizione, che prevale soprattutto per shock negativi, induce a presumere la possibile influenza
del segno dell’errore sulla dimensione della relativa volatilità condizionata.
Riconsiderando le seguenti caratteristiche, siamo in grado di stabilire che: i rendimenti sono
completamente diversi dal teorico processo white noise gaussiano, e proprio perché le variabili casuali che
descrivono il processo non sono tra loro identicamente distribuite è possibile determinare dei legami tra le
diverse osservazioni; nel concreto è quindi possibile associare alle varie serie un processo di generazione
dei dati, che è in grado di considerare un istante di partenza per ottenere informazioni sulle realizzazioni
future. Le realizzazioni future diventano così stimabili in media secondo la definizione di rendimento atteso
condizionato.
Il rendimento atteso condizionato si sviluppa dalla definizione dei modelli a media condizionata, che
partendo dai modelli autoregressivi lineari, evolve poi in letteratura con diverse formulazioni più complesse
arrivando fino ad espressioni non lineari.
15 G. Gabbi, “Definizione, misurazione, gestione del rischio reputazionale degli intermediari bancari”,
(1999)
13
Modelli Autoregressivi e Media Mobile
Per la specificazione dei nostri processi stocastici, siamo partiti dalla letteratura concernente le
modulazione lineare nei parametri, che fa presumere l’esistenza di una dipendenza lineare tra le
osservazioni del processo generatore dei log-rendimenti. Definiamo così il modello auto regressivo di primo
ordine (Auto-regressive of order 1 – Ar(1)):
(1.2) = + − 1
+ ,
dove indica un’innovazione serialmente non correlata con media nulla e varianza costante, classificata
come processo white noise. In questo modello sono assunte indirettamente le condizioni di stazionarietà e
le condizioni di invertibilità. Infatti, un processo stocastico è definito stazionario in senso stretto se, le sue
proprietà non dipendono dalla variazione della data che individua l’origine del tempo. Questo impone che
le covarianze tra due generiche non dipendano da t. Nel momento in cui si ha interesse solo per le
medie, varianza e covarianze è possibile imporre la loro indipendenza dal tempo in maniera meno
restrittiva, operando le seguenti assunzioni:
(1.3) = µ < ∞,
= [( − µ)
2]
= ƴ
0
< ∞,
, − = [ − µ − − µ = ƴ
,
e per il caso in cui ~ AR(1), | | < 1.
Dove le prime tre condizioni individuano le proprietà di stazionarietà in senso debole per un processo
stocastico. La prime due espressioni impongono che la media e la varianza siano finite e costanti nel tempo,
mentre la terza determina che la funzione di autocovarianza dipenda esclusivamente dalla distanza
temporale tra le due osservazioni. L’ultima assunzione identifica la condizione di invertibilità del polinomio
di ritardo, che permette la riformulazione del processo stesso in uno a media mobile di ordine infinito
MA(∞).
Nel caso di assunta stazionarietà, si è in grado di determinare le informazioni fondamentali per la
formulazione delle previsioni future: valore atteso, auto covarianza e varianza, che altrimenti sarebbero
caratterizzate da esplosività nei processi o trend aleatori imprevedibili.
14
Se infatti si assume che E( ) e V( ) non dipendano da t e quindi sia imposta la (1.3), è possibile ottenere
dal modello i seguenti risultati:
(1.4) =
1− ;
(1.5) =
2
1− 2
;
(1.6) Cov y
t
, y
t−k
= θ
k
σ
2
1− θ
2
.
Un processo AR(1) può anche essere riformulato come un processo a media mobile di ordine infinito
MA(∞) secondo il Teorema di Wold, sotto la condizione di stazionarietà in (1.3), ed iterando n volte la
sostituzione al secondo membro del valore ritardato di − 1
otteniamo la seguente espressione:
(1.6) = µ + − − µ + −
− 1
=0
;
dove µ è riconducibile alla equazione (1.4).
Se però n → ∞, l’espressione in (1.6) può essere semplificata, eliminando il secondo termine a destra
dell’uguaglianza a causa della sua convergenza a zero, fino ad ottenere:
(1.7) = µ + −
∞
=0
;
dove µ rappresenta il valore atteso espresso in (1.4).
L’espressione formulata in (1.6) è molto utile per determinare il nostro obiettivo previsionale, perché
permette la semplice definizione dell’entità definita come predittore ottimale di . Il predittore ottimale è
la misura che viene stimata da una funzione dipendente dal set informativo di dati seriali, quest’ultimo
definito con :
(1.8) = {
, − 1
, − 2
, . .. , − } ;
dove contiene, in forma generica, l’insieme di informazioni relative alle nostre variabili d’interesse
disponibili all’istante temporale in cui viene fatta la previsione.
Il criterio di scelta del predittore, determinato tra i vari possibili, corrisponde alla minimizzazione della
seguente equazione:
15
(1.9) Min. : [( + − ŷ
+ | )
2
| ];
con cui viene espressa la volontà di minimizzare l’errore quadratico medio, dato l’insieme informativo .
E’ intuitivamente facile comprendere che il predittore ottimale corrisponde al valore atteso condizionale di
+ . In termini più rigorosi possiamo generalizzare, partendo dall’espressione (1.6), la formulazione della
previsione relativa ad h passi avanti come:
(1.10) + | = µ + ( − µ ) ;
che determina, nel caso in cui la previsione coinvolga una serie di passi in avanti tale da portare n → ∞ , la
convergenza della previsione al suo valore centrale, µ . Questa valutazione sulla convergenza asintotica
risulta importante per comprendere l’evolversi della previsione all’allontanarsi dall’istante campionario t.
Come evidenziato nella formulazione (1.6) il processo AR(1) può essere trasformato in un modello MA (∞),
che rappresenta un modello a media mobile con ritardi aggiuntivi al primo. Definiamo prima per chiarezza il
modello MA(1):
(1.11) = µ + + − 1
;
dove il processo è generato dalla ponderazione di un processo a rumore bianco (white noise). Il valore
atteso, varianza e autocovarianze del modello sono esprimibili nella seguente forma:
(1.12) = + − 1
2
= 1 + 2
2
;
= µ ;
(1.13) , − 1
= + − 1
− 1
+ − 2
= ( − 1
2
) = 2
;
(1.14) , − = 0, per = 2, 3, 4,…
nella quale si evince il fatto che le autocovarianze si riducano a zero per ritardi che differiscano di due o più
periodi. Questa notazione ci permette di sottolineare come le autocorrelazioni varino nei i due modelli tra
ritardi della serie. Nei grafici relativi alle figure 1.1, 1.2, 1.3, 1.4, vengono rappresentate le funzioni di
autocorrelazione relative alle due implicazioni strutturali AR(1) e MA(1).
16
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9 10
Funzione di autocorrelazione teorica:
AR(1), θ= 0,9
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9 10
Funzione di autocorrelazione teorica:
Ma(1), θ= 0,9
0
0,1
0,2
0,3
0,4
0,5
0,6
1 2 3 4 5 6 7 8 9 10
Funzione di autocorrelazione teorica:
AR(1), θ= 0,5
0
0,1
0,2
0,3
0,4
0,5
0,6
1 2 3 4 5 6 7 8 9 10
Funzione di autocorrelazione teorica:
Ma(1), θ = 0,5
Figura 1.1
Figura 1.2
Figura 1.3
Figura 1.4
17
Il caso più generale: formulazione del processo ARMA
Il processo autoregressivo ed il processo a media mobile sono possibili di estensione, tramite l’aggiunta di
ritardi d’ordine superiore al primo nelle equazioni espresse in (1.2) e in (1.11), e mantengo comunque
l’invertibilità del polinomio di ritardo sotto alcune condizioni
16
. Il polinomio di ritardo è definibile come un
filtro, che applicato ad un processo generico , determina la trasformazione del medesimo in un white
noise process
17
.
Con l’introduzione di questo nuovo operatore siamo in grado di esprimere in maniera sintetica le
formulazioni generalizzate AR(p) e MA(q), per poi descrivere la forma ARMA(p,q). Il processo AR(p) è
definito secondo l’equazione seguente:
(1.15) = ,
dove è un polinomio di ordine p nell’operatore , espresso da:
(1.16) = 1 − 1
1
− 2
2
− …− ,
mentre il processo MA(q) è definito come:
(1.17) = ,
dove è un polinomio di grado q in espresso da:
(1.18) = 1 + 1
1
+ 2
2
+ … + .
16 L’operatore ritardo è definito da: = − ,
e gode delle seguenti proprietà: 0
= 0, −1
= +1
, µ = µ .
Le condizioni di invertibilità sono realizzate se il polinomio di ritardo definito in (1.16) sussistono nel caso in
cui | ф
| < 1 e ∀ ∈ , dove ф
è il generico coefficiente del polinomio ritardo nell’uguaglianza:
1 − 1
1
− 2
2
− …− = (1 − ф
)
1
.
17 Ad esempio se applichiamo l’operatore ritardo ad un processo AR(1) otteniamo: = + =
= (1 – θL) = , dove è il processo predefinito ~ ( 0 , 2
). Quindi possiamo verificare
l’espressione (1.6) = (1 − )
−1
=
∞
=0
.
18
Entrambe le specificazioni possono essere trasformate nelle diverse forme sopraindicate quando i polinomi
in risultano invertibili, e sotto l’ipotesi che tutte le soluzioni dell’equazione caratteristica siano esterne al
cerchio unitario
16
.
L’utilità delle seguenti specificazioni permette l’identificazione della specificazione ARMA, che si sviluppa
come rappresentazione più parsimoniosa contenente una componente autoregressiva ed una componente
a media mobile. Il modello ARMA(p,q) può essere scritto come:
(1.19) = ,
che può, a verificate condizioni di invertibilità, essere riscritto sotto forma di MA(∞) o di AR(∞):
(1.20) = −1
,
(1.21) −1
= .
I polinomi −1
, −1
hanno lunghezza di ordine infinito con coefficienti vincolati.
La comodità della formulazione ARMA(p,q) si scontra con il problema delle radici comuni, o radici
semplificabili. Questo fenomeno insorge nel caso in cui le componenti autoregressive e quelle a media
mobile contengono due radici uguali tra di loro, con conseguenza di possibile semplificazione. E’ possibile
comprendere il problema con un semplice esempio generico.
Se si suppone, che la corretta specificazione per un processo , sia il modello ARMA(2,1) descritto da:
1 − 1
1
− 2
2
= 1 + 1
1
,
che può essere riformulato come:
1 − ф
1
1 − ф
2
= 1 + 1
1
.
Nel caso in cui sia 1
= − ф
2
, è possibile semplificare il modello dividendo entrambi i membri per
1 + 1
1
, ottenendo così:
1 − ф
1
= ,
che è uguale all’identificare un modello ARMA(1,0) (ovvero un AR(1)) come espressione del processo .