3
1.3 – L’analisi delle serie storiche in un’azienda petrolifera
Un prodotto che si vende da sé , un prodotto indispensabile per una società come quella
contemporanea , un prodotto al centro di enormi interessi internazionali e che è stato se non la
causa, una delle cause di alcuni dei più grandi conflitti politico-militari del nostro tempo…questo è
il petrolio, dalla cui raffinazione si ottengono le principali fonti di energia della nostra società ,
benzina e gasolio.
In questo contesto e in un mercato ormai saturo operano le aziende petrolifere, cresciute in
competitività proprio negli ultimi dieci anni, per far fronte a una crisi del settore che è sempre più
una realtà del nostro tempo.
In tal modo funzioni aziendali considerate fino a poco tempo fa di secondaria importanza , sono
diventate oggi importantissime e tutt’altro che trascurabili: è il caso della funzione del marketing e
della funzione del business & reporting analysis.
La prima ha come obiettivo la fidelizzazione della clientela tramite campagne pubblicitarie e di
marketing quali possono essere ad esempio gli sconti o i premi fedeltà; la seconda si occupa invece
di analizzare al meglio i dati aziendali divenendo la base da cui partire per operare eventuali
miglioramenti interni.
Proprio l’evoluzione di queste due funzioni e la sempre maggiore importanza assunta da esse ha
portato al centro dell’attenzione aziendale l’analisi delle serie storiche dei prodotti venduti
dall’azienda.
Si è visto infatti che la conoscenza del passato e la formulazione di ipotesi plausibili riguardanti il
futuro avrebbero posto la società in una posizione d’avanguardia rispetto alle altre , e avrebbe
portato ingenti vantaggi anche e soprattutto dal punto di vista economico: conoscere il passato per
non ripetere gli errori fatti , comprendere il passato per poter prevedere il futuro puntando alla
continua innovazione.
L’unico modo di analizzare il passato utilizzato dall’azienda in questione è quello di avvalersi della
valutazione soggettiva di esperti del settore petrolifero italiano: in base alla visione analitica del
passato e alla personale sensibilità verso il futuro vengono fatte previsioni di breve termine
riguardanti la vendita nazionale di carburante.
Questo sistema ha però provocato errori sempre più grandi , proporzionali alla crescente instabilità
del settore verificatasi negli ultimi anni; tutto ciò ha spinto l’azienda a sperimentare metodi statistici
e analitici da affiancare ai metodi tradizionali alfine di ottenere una previsione che si discosti il
meno possibile dalla realtà.
1.4 - Obiettivo
Lo studio effettuato si pone come scopo principale quello di riuscire a costruire un valido modello
di previsione dei consumi di carburante in Italia in termini di vendita , in modo da realizzare una
previsione efficiente ed affidabile , che si discosti il meno possibile dal valore reale di vendita.
Le sempre più instabili condizioni dell’industria petrolifera rendono particolarmente arduo questo
compito, ma la costruzione di un buon modello di previsione dei consumi petroliferi nazionali
permetterebbe vantaggi tutt’altro che secondari , come la possibilità di capire in anticipo l’evolversi
del mercato consentendo una valida previsione anticipata della quota di mercato aziendale e la
possibilità di indirizzare al meglio le azioni di marketing.
Quello di cui ha bisogno l’azienda è che quindi l’errore di previsione a breve termine sia molto
basso; per questo motivo si cercherà di costruire un modello di previsione che sia ottimizzato
tenendo in considerazione anche un punto di vista statistico, ma soprattutto un punto di vista
euristico.
4
In altre parole il modello selezionato sarà quello che avrà ottenuto i risultati migliori dopo essere
stato verificato sul campo , ossia quello con una storia previsiva più forte e quindi errori di
previsione più bassi , anche in casi di ipotesi statistiche solo parzialmente soddisfatte.
La serie storica di riferimento per un’azienda petrolifera è la serie della vendita aggregata di
carburante , la quale comprende la vendita al dettaglio , in milioni di tonnellate , dei due principali
prodotti presenti sul mercato italiano e mondiale , benzina e gasolio , nei confronti di tutti i veicoli
da autotrazione; da tale studio è perciò esclusa la vendita di carburante destinato a un diverso
utilizzo (come il gasolio impiegato per il riscaldamento domestico) , visto che in ambito aziendale
queste vendite vengono indicate come extra-vendite e sono studiate a parte.
Nella figura 1.0 possiamo osservare l’andamento della serie mensile della vendita di carburante in
Italia da gennaio 1997 ad ottobre 2007:
Vendita di Carburante in Italia
1.900
2.000
2.100
2.200
2.300
2.400
2.500
2.600
2.700
g
e
n
-
9
7
l
u
g
-
9
7
g
e
n
-
9
8
l
u
g
-
9
8
g
e
n
-
9
9
l
u
g
-
9
9
g
e
n
-
0
0
l
u
g
-
0
0
g
e
n
-
0
1
l
u
g
-
0
1
g
e
n
-
0
2
l
u
g
-
0
2
g
e
n
-
0
3
l
u
g
-
0
3
g
e
n
-
0
4
l
u
g
-
0
4
g
e
n
-
0
5
l
u
g
-
0
5
g
e
n
-
0
6
l
u
g
-
0
6
g
e
n
-
0
7
l
u
g
-
0
7
M
i
g
l
i
a
i
a
d
i
t
o
n
n
e
l
l
a
t
e
(
k
t
o
n
s
)
fig.1.0 – Fonte Unione Petrolifera
Tale serie storica , che pure ci dà un’indicazione di massima sull’andamento dei consumi di
carburante , verrà sostituita , nello studio che verrà esposto nel seguito , dalle due serie disaggregate
che la compongono , la serie della benzina e la serie del gasolio , le quali , seppure componenti la
medesima serie aggregata, risulteranno avere sostanziali differenze e peculiarità tali da
diversificarle l’una dall’altra.
5
2 - SERIE STORICA DELLA BENZINA
2.1 - Serie storica grezza
Iniziamo il nostro studio osservando il grafico della serie storica della vendita di benzina in Italia ;
questo grafico serve a darci un’idea di fondo riguardo ai movimenti della serie storica e a farci
capire qual è il punto di partenza di questa.
Vendita di Benzina
800
900
1.000
1.100
1.200
1.300
1.400
1.500
1.600
1.700
g
e
n
-
9
7
l
u
g
-
9
7
g
e
n
-
9
8
l
u
g
-
9
8
g
e
n
-
9
9
l
u
g
-
9
9
g
e
n
-
0
0
l
u
g
-
0
0
g
e
n
-
0
1
l
u
g
-
0
1
g
e
n
-
0
2
l
u
g
-
0
2
g
e
n
-
0
3
l
u
g
-
0
3
g
e
n
-
0
4
l
u
g
-
0
4
g
e
n
-
0
5
l
u
g
-
0
5
g
e
n
-
0
6
l
u
g
-
0
6
g
e
n
-
0
7
l
u
g
-
0
7
M
i
g
l
i
a
i
a
d
i
T
o
n
n
e
l
l
a
t
e
(
k
t
o
n
s
)
fig.2 – Fonte Unione Petrolifera
Nel grafico (fig.2) sono riportate le vendite mensili di benzina in ktons dal gennaio 1997 all’ottobre
2007. Si può osservare che le vendite di benzina sono gradualmente e progressivamente scese nel
tempo ; ciò può essere spiegato dalla grande diffusione del gasolio dal 2000 in poi , non solo per
veicoli di grossa cilindrata e adibiti al trasporto merci (come camion o rimorchi) , ma anche e
soprattutto per veicoli di piccola cilindrata come utilitarie e automobili per famiglie ; la capillare e
puntuale nascita di distributori di gasolio vicino ai classici distributori di benzina , correlata a un
minore prezzo al consumo di quest’ultimo , ha fatto man mano scendere i consumi di benzina ,
proprio a favore del gasolio.
Tale ipotesi è sostenuta anche dall’andamento delle vendite di automobili , andamento pressoché
costante negli ultimi 7 anni , ma nel quale si è verificata una redistribuzione della tipologia di
automobili vendute: mentre nel giugno 1996 le automobili a gasolio vendute avevano un’incidenza
del 32% sul totale , a settembre 2006 si è passati a un’incidenza del 58% sul totale (fonte Istat).
6
2.2 - Serie storica annuale
Una considerazione che può essere fatta osservando il grafico in figura 1 è l’irregolarità di ogni
mese rispetto al successivo ; in particolare si può vedere come le vendite cambiano radicalmente di
mese in mese , e come invece siano pressoché simili o con poco spostamento considerando gli stessi
mesi in anni differenti ; sembra esserci quindi una forte presenza di stagionalità.
Per vedere se la nostra intuizione è valida consideriamo i grafici annuali della serie storica :
Vendita Benzina Gennaio
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Vendita Benzina Febbraio
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1997 1998 1999 2000 1 2 3 4 5 2006 2007
fig.2.1 fig.2.2
Vendita Benzina Marzo
800
900
1000
1100
12
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Vendita Benzina Aprile
800
900
1000
1100
12
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
fig.2.3 fig.2.4
7
Vendita Benzina Maggio
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Vendita Benzina Giugno
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
fig.2.5 fig.2.6
Vendita Benzina Luglio
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Vendita Benzina Agosto
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
fig.2.7 fig.2.8
Vendita Benzina Settembre
800
900
1000
1100
12
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Vendita Benzina Ottobre
800
900
1000
1100
1200
1300
1400
1500
1600
17
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
fig.2.9 fig.2.10
8
Vendita Benzina Novembre
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
Vendita Benzina Dicembre
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1997 1998 1999 200 2001 2002 2003 2004 2005 2006
fig.2.11 fig.2.12
I grafici annuali mostrano come l’andamento delle vendite sia differente , in termini di tonnellate ,
di mese in mese ; il mese di luglio , ad esempio , avrà un quantitativo di vendite completamente
differente dal mese di giugno , nonostante si tratti di due mesi consecutivi nel calendario.
Quanto detto potrebbe essere molto importante poiché , ai fini del nostro studio , potrebbe essere
molto più proficuo lavorare sulle serie annuali e non sulla serie mensile , nonostante una
notevolissima perdita di informazioni : si passa infatti da 132 osservazioni ad 11 per diminuire
ancora a 10 nei mesi di novembre e dicembre (vedi fig. 2.11 e fig. 2.12).
2.3 - La variabile giorni lavorativi e l’indice di prezzo
Come abbiamo detto all’inizio , il nostro obiettivo è quello di costruire un modello di previsione
affidabile , capace di prevedere la quantità di benzina che sarà venduta in Italia nei periodi futuri , e
capire quali sono le variabili che influenzano in modo consistente tali vendite.
Il secondo passo del nostro studio quindi , sarà quello di cercare tali variabili e , dopo averne
dimostrato la significatività statistica , affiancarle alla serie storica in nostro possesso.
Le caratteristiche fondamentali di queste variabili devono essere principalmente due: reperibilità e
affidabilità ; reperibilità affinché siano facilmente e prontamente individuabili e trascrivibili ,
affidabilità affinché siano indicatori sicuri e non provenienti a loro volta da previsioni.
A tal proposito sono state individuate due variabili che potrebbero influenzare in maniera decisa la
vendita di benzina :
ξ la variabile giorni lavorativi
consiste nel numero di giorni lavorativi dei distributori di vendita di benzina al dettaglio ; è
lecito infatti pensare che più giorni lavorativi ci sono in un mese, e più benzina viene
venduta nel panorama nazionale ; i distributori lavorano a pieno regime dal lunedì al sabato,
ma vengono riforniti soltanto dal lunedì al venerdi, cioè solo 5 giorni a settimana ; pertanto i
giorni lavorativi varieranno di mese in mese , essendo sempre di numero differente poiché
ogni mese avrà un diverso numero di sabati e domeniche , senza contare particolari tipi di
festività come la Pasqua , sempre in date differenti anno per anno.
9
ξ la variabile indice di prezzo al consumo della benzina
consiste nell’indice di prezzo che un’automobilista paga per litro di benzina ; è lecito infatti
supporre che la richiesta di benzina cali all’aumentare del prezzo.
2.4 – Analisi classica sulla serie storica mensile
Abbiamo visto nei paragrafi precedenti l’esistenza di due possibilità per la costruzione del nostro
modello: considerare la serie storica mensile della benzina oppure considerare le dodici serie
storiche annuali vista la presenza di forte stagionalità.
Iniziamo dalla serie storica mensile e procediamo a un’analisi tradizionale:
Il grafico in alto mostra l’andamento della serie storica destagionalizzata (indicata con il termine
“corretto”) in relazione alla serie storica originaria;
il grafico di mezzo mostra allo stesso modo l’andamento della componente trend/ciclo rispetto alla
serie storica originaria;
il grafico in basso infine mostra l’andamento della componente deterministica o residuale.
Possiamo osservare dunque la presenza di forte stagionalità nella serie.
10
2.5 - Regressione Lineare sulla serie storica mensile
Dopo aver scomposto la serie nelle sue componenti principali seguendo il metodo classico,
applichiamo a tale serie un modello di regressione lineare del tipo:
Yt = ∆ + Ε1X1t + Ε2X2t + Γt + Ηt
ξ Yt è la variabile dipendente o endogena e rappresenta la quantità di benzina (in milioni di
tonnellate) venduta al tempo t.
ξ X1 e X2 sono i regressori cioè le variabili indipendenti o esogene e rappresentano
rispettivamente il numero di giorni lavorativi al tempo t dell’industry della benzina e
l’indice di prezzo al consumo al tempo t della benzina.
ξ ∆ è l’intercetta della retta di regressione Ε1X1t + Ε2X2t e rappresenta anche il valore atteso
di Y quando tutte le X (cioè X1 e X2) sono pari a 0.
ξ Γt rappresenta il trend della serie storica.
ξ Ηt è l’errore o disturbo statistico.
ξ Ε1 e Ε2 sono rispettivamente i coefficienti angolari di X1 e X2 e saranno opportunamente
stimati.
Procediamo quindi con la regressione lineare utilizzando il software per analisi econometriche
Gretl.
L’applicazione del modello Yt = ∆ + Ε1X1t + Ε2X2t + Γt + Ηt ai dati mensili della vendita di
benzina dà i seguenti risultati:
Modello: Stime OLS usando le 130 osservazioni 1997:01-2007:10
Variabile dipendente: kt_bnz
VARIABILE COEFFICIENTE ERRORE STD STAT T P-VALUE
const 945,1 157,7 5,9 <0,00001 ***
gg 38,3 5,8 6,6 <0,00001 ***
prezzi -2,0 1,0 -1,8 0,06122 *
time -3,5 0,3 -8,8 <0,00001 ***
tab.1
Media della variabile dipendente = 1280,8
Scarto quadratico medio della variabile dipendente = 181,931
Somma dei quadrati dei residui = 744329
Errore standard dei residui = 76,8595
R-quadro = 0,825675
R-quadro corretto = 0,821524
Statistica F (3, 126) = 198,929 (p-value < 0,00001)
Statistica Durbin-Watson = 1,41692
Coefficiente di autocorrelazione del prim'ordine = 0,253853
Log-verosimiglianza = -746,888
11
Criterio di informazione di Akaike (AIC) = 1501,78
Criterio bayesiano di Schwarz (BIC) = 1513,25
Criterio di Hannan-Quinn (HQC) = 1506,44
Le informazioni principali che si possono osservare sono due:
ξ le variabili indipendenti da noi scelte (n°di giorni lavorativi e indice di prezzo al
consumo della benzina) risultano significative , così come la costante e il trend
temporale (statistica t minore in valore assoluto di 2 e basso p-value)
ξ basso valore dell’R-quadro pari a 0,8256 ;
Ricordiamo che l’obiettivo di questo lavoro è quello di realizzare un modello di previsione
affidabile , cioè che si discosti il meno possibile dai valori reali dell’industry della benzina ;
per fare questo diventa necessario , se non fondamentale , avere un R-quadro che si avvicini
il più possibile al massimo cioè a 1 ; ricordiamo che l’indice di determinazione misura il
grado di accostamento della retta interpolata ai dati campionari cioè quanto una linea di
regressione approssima i dati reali ; rappresenta in sintesi una proporzione tra la variabilità
dei dati e la correttezza del modello statistico utilizzato ed è compreso tra 0 e 1.
Un modello di previsione affidabile non può prescindere da un alto valore dell’R-quadro , ed
in questo senso la serie storica mensile della vendita di benzina non ci viene incontro.
Per avere un’idea più precisa della situazione osserviamo la bontà di adattamento del
modello analizzando il grafico relativo agli scostamenti tra valori stimati dal modello e
valori reali:
fig.3