Pagina 4
l’individuo scelga l’alternativa con la più alta utilità, l’utilità non è nota
con certezza all’analista ed è trattata da questi come una variabile
aleatoria. Così la probabilità che un’alternativa sia scelta è definita
come la probabilità che abbia la più alta utilità fra le varie alternative.
Nel capitolo 1 sono stati mostrati la teoria e le proprietà dei vari
modelli di scelta. Dopo una breve introduzione alla teoria di scelta
individuale sono stati mostrati vari modelli di scelta ; il Logit Binario ed
il Probit binario, il Logit Multinomiale ed il Nested Logit. Per poter
valutare la correttezza di un modello rispetto ad un altro sono stati
mostrati vari test statistici, mentre per valutare la sensitività di un
modello è stato presentato il concetto di elasticità e le relative formule.
Nel capitolo 2 sono stati mostrati i dati in nostro possesso e come
sono stati filtrati per depurarli dei record e dei campi non necessari. A
questo punto abbiamo mostrato analisi statistiche e grafici prima
considerando solo i pazienti che si sono rivolti all’ospedale di Pistoia e
Pescia, riferiti ad alcuni reparti e poi globalmente, e poi considerando i
pazienti residenti nella provincia di Pistoia. Tramite queste statistiche
abbiamo raccolto informazioni che ci sono risultate utili nell’analisi dei
risultati ottenuti dall’implementazione dei modelli decisionali scelti.
Nel capitolo 3 abbiamo proceduto a fare una breve introduzione al
linguaggio di programmazione S-plus utilizzato per implementare i
modelli di scelta.
Nel capitolo 4 sono stati mostrati i risultati numerici dei parametri
stimati per i vari modelli di scelta implementati. Inoltre sono stati
mostrati i risultati dei vari test statistici utilizzati per valutare la bontà
del modello utilizza to e l’analisi di sensitività.
Per finire nel capitolo 5 sono state discusse le conclusioni dei metodi
implementati.
Pagina 5
Capitolo 1
Modelli di scelta
Pagina 6
1.1 Teoria della scelta individuale.
Procediamo adesso a prendere in considerazione i problemi di scelta,
intendendo con questo termine una sequenza di azioni eseguite da una
persona o da un gruppo di persone che, fra varie alternative relative ad
un loro problema, scelgono quella che ritengono più congeniale.
Analizziamo il termine “scelta”.
1.1.1 La struttura della teoria della scelta.
Per arrivare ad una scelta si eseguono vari passi, che fanno parte del
processo di decisione:
1. Definizione del problema di scelta.
2. Generazione delle alternative.
3. Valutazione degli attributi delle varie alternative.
4. Scelta.
5. Esecuzione della scelta.
Un esempio classico di scelta è quella che si pone ad un lavoratore
che deve scegliere il mezzo di trasporto più idoneo per recarsi a
lavoro. Supponiamo che gli si presentino le seguenti alternative:
andare a piedi, in autobus o in macchina. Il passo successivo sarà di
raccogliere e valutare le informazioni sulle caratteristiche delle varie
opzioni, ad esempio il tempo di viaggio, il costo e il comfort. Il passo
finale sarà quello di eseguire il viaggio seguendo la scelta fatta.
In un processo di scelta si distinguono:
1. Chi fa la scelta, può essere una persona o un gruppo di persone
come una famiglia, un’organizzazione, una ditta e così via.
2. Le alternative: per un determinato problema vi potranno essere più
soluzioni, ma per chi deve fare la scelta non è detto che tutte le
alternative siano possibili, per esempio ricollegandosi all’esempio
del lavoratore che deve recarsi a lavoro, l’ipotesi di prendere
l’autobus potrebbe non essere possibile se nella zona dove abita
Pagina 7
non sono presenti fermate dell’autobus. Inoltre l’insieme delle
possibile scelte può essere continuo (come ad esempio la quantità
di latte (q1) e carne (q2) acquistate da una famiglia), oppure
discontinuo o discreto come il caso del lavoratore che deve recarsi
a lavoro.
3. Gli attributi delle alternative: l’attrattiva di un’alternativa rispetto ad
un’altra viene valutata in termini dei valori del vettore degli attributi
di ciascuna di queste.
4. Le regole di decisione: Possono esserci varie regole per valutare le
alternative e formulare la scelta:
� Dominanza: Un’alternativa è dominante rispetto ad un’altra se è
migliore per almeno un attributo e non è peggiore relativamente agli
altri attributi. Purtroppo nelle scelte reali è difficile che si presenti un
caso simile, inoltre riprendendo il caso del lavoratore che deve
andare a lavoro, una differenza di 5 minuti nel tempo impiegato dal
recarsi in macchina o in autobus può ritenersi troppo poco per
essere determinante nella scelta, quindi e’ importante in questo
caso porre una soglia.
� Regola lessicografica : supponiamo che gli attributi siano
ordinati per livello d’importanza e ipotizziamo di avere un certo
numero di alternative. Si scelgono le alternative che sono più
attraenti rispetto all’attributo più importante, se dopo questo primo
passo non si giunge ad una scelta unica, si procede ad analizzare il
secondo attributo in ordine d’importanza del sottoinsieme ricavato e
si continua finché il processo non ottiene una scelta unica.
� Utilità: l’attrattiva di un’alternativa, espressa come un vettore di
attributi, è ridotta ad uno scalare. Questa operazione viene eseguita
da una funzione vettoriale che si chiama d’utilità. Si procederà a
scegliere l’alternativa che ha utilità massima. Riferiamoci al
Pagina 8
problema di scelta del lavoratore che si deve recare a lavoro, e
analizziamo la tabella 1.1 qui sotto:
Tempo di viaggio
(t)
Costo viaggio
(c)
Comfort
viaggio (o)
Automobile
T
1
C
1
0
1
Autobus
T
2
C
2
0
2
A piedi
T
3
C
3
0
3
Tabella 1.1
le informazioni relative agli attributi di ogni alternativa, si riducono a
tre valori scalari d’utilità, U
1
,U
2
,U
3
. Il lavoratore sceglierà il modo di
viaggio che avrà l’utilità più alta. Dunque il modo di viaggio più
costoso potrebbe essere scelto se questo attributo sarà
compensato sufficientemente dall’offerta di un servizio migliore.
La funzione di utilità dipenderà dagli attributi z
in
ogni alternativa i
(come comfort, costo e così via) e da un vettore S
n
, che
rappresenta le caratteristiche socioeconomiche (come il reddito,
l’età e così via) di chi deve fare la scelta, indicato con n. Possiamo
dunque scrivere:
U
in
= U(z
in
, S
n
) (1.1)
1.2 Teoria della probabilità applicata ai problemi di
scelta.
La necessità di applicare la teoria della probabilità ai problemi di scelta,
nacque dalla constatazione che in determinati esperimenti lo stesso
individuo posto più volte dinanzi allo stesso problema non sempre
effettuava la stessa scelta.
Inoltre osservando le scelte fatte da un campione di individui, in alcuni
casi due o più individui con lo stesso insieme di scelta, attributi,
caratteristiche socioeconomiche, facevano scelte diverse.
Alla luce di ciò la teoria della probabilità viene usata per catturare in
colui che è chiamato a fare la scelta le variazioni non osservabili dei
Pagina 9
gusti e gli attributi non osservabili relativi alle varie alternative. Quindi la
teoria della probabilità può essere utilizzata per migliorare le
metodologie precedentemente menzionate.
1.2.1 Utilità costante.
Con questo approccio l’utilità delle varie alternative è fissa. Invece di
selezionare l’alternativa con l’utilità più alta si suppone che chi deve
eseguire la scelta abbia a che fare con una probabilità di scelta
definita da una distribuzione di probabilità che include l’utilità come un
parametro.
1.2.2 Utilità aleatoria.
Con questo metodo si suppone sempre che l’individuo scelga
l’alternativa con la più alta utilità, l’utilità non è nota con certezza
all’analista ed è trattata da questi come una variabile aleatoria. Si ha
dunque che la probabilità che venga scelta l’alternativa i, è uguale alla
probabilità che l’utilità dell’alternativa i, U
in
, sia maggiore o uguale
all’utilità delle altre alternative nell’insieme di scelta. E cioè più
formalmente:
P( i | C
n
) = Pr[U
in
� U
jn
per tutti j� C
n
] (1.2)
Ove con C
n
si indica l’insieme di tutte le alternative possibili per
l’n_esima persona che deve eseguire la scelta e con U
in
e U
jn
l’utilità
dell’alternativa i e j rispettivamente.
Mansky (1973) ha identificato 4 distinte sorgenti di casualità:
1. Attributi non osservabili.
2. Variazioni di gusti non osservabili.
3. Errori di misura e informazioni errate.
4. Variabili strumentali.
Analizziamo singolarmente queste voci:
Attributi non osservabili: Il vettore degli attributi che influisce sulla
decisione è incompleto. La funzione d’utilità è dunque:
Pagina 10
Uin=U(zin,Sn,zUin) (1.3)
Questa include un elemento zUin che è una variabile aleatoria non
osservabile, e conseguentemente l’utilità è essa stessa aleatoria.
Variazioni di gusti non osservabili: La funzione d’utilità
Uin=U(zin,Sn,SUin) (1.4)
Contiene variabili non osservabili SUin che variano da individuo ad
individuo, siccome la variazione SUin non è nota, Uin è essa stessa una
variabile aleatoria.
Errori di misura ed informazioni errate: La vera funzione d’utilità è:
Uin=U(zin,Sn) (1.5)
Ove l’attributo zin non è osservabile, noi osserviamo zin che è una
misura imperfetta di zin. Noi sostituiamo
zin= zin + ein (1.6)
dove ein è un errore di misura non noto dentro la funzione di utilità
(1.21) che contiene un elemento aleatorio.
Variabili strumentali: La vera funzione d’utilità è:
Uin=U( inz ′′ ,Sn) (1.7)
Ma alcuni elementi di
inz ′′ non sono osservabili, dunque inz ′′ è sostituita
con zin,. Procediamo a sostituire
inz ′′ =g(zin)+ ine ′′ (1.8)
dove g(.) rappresenta l’imperfetta relazione fra strumenti e attributi e
ine ′′ è un errore aleatorio. Sostituendo questa relazione all’interno di
(1.6) si ottiene:
Uin=U(g(zin)+ ine ′′ ,Sn) (1.9)
Che contiene un elemento casuale.
In generale, possiamo rappresentare l’utilità aleatoria di un’alternativa
come la somma di componenti osservabili (sistematiche) e non
osservabili nel seguente modo:
Pagina 11
U
in
= V(z
in,
S
n
) + e( z
in,
S
n
) = V
in
+ e
in
(1.10)
Dunque l’espressione (1.2) può essere riscritta nel seguente modo:
P( i | C
n
) = Pr[V
in
+ e
in
� V
jn
+ e
jn
per tutti j� C
n
] (1.11)
Per ottenere un modello di utilità aleatorio, necessitiamo di ipotesi
sulla distribuzione congiunta di probabilità di tutto l’insieme dei
disturbi.
1.3 I modelli di scelta binaria.
Abbiamo visto nel paragrafo precedente che nei modelli d’utilità
aleatoria la probabilità di scegliere una qualsiasi alternativa i da parte di
una persona n dall’insieme di scelta C
n
è data dalla seguente formula:
P( i | C
n
) = Pr[U
in
� U
jn
per tutti j� C
n
] (1.12)
In questo paragrafo procediamo ad analizzare modelli di scelta in cui C
n
contenga esattamente due alternative. Per convenienza si considererà
C
n
={i,j}, dove ad esempio l’alternativa i potrebbe essere per il nostro
lavoratore l’opzione di prendere la macchina per andare a lavorare
mentre l’opzione j la possibilità di recarsi in autobus. La probabilità che
la persona n scelga l’alternativa i è
P
n
(i) = Pr(U
in
� U
jn
) (1.13)
E la probabilità di scegliere l’alternativa j è:
P
n
(j)=1- P
n
(i) (1.14)
Il nostro fine sarà quello di sviluppare la della teoria dei modelli di scelta
aleatori nel caso binario (due alternative).
Procediamo in tre passi:
1. Separare la funzione d’utilità totale in una parte deterministica e in
una parte aleatoria.
2. Specificare la parte deterministica.
3. Specificare la parte aleatoria.
Procediamo ad analizzare singolarmente queste voci:
Pagina 12
1.3.1 Componente deterministica e aleatoria nell’utilità.
Tenendo conto che U
in
e U
jn
sono variabili aleatorie possiamo
procedere a dividere ciascuna di queste nel seguente modo:
U
in
= V
in
+ e
in
U
jn
= V
jn
+ e
jn
(1.15)
Ove V
in
e V
jn
sono le componenti deterministiche dell’utilità di i e j,
mentre e
in
e e
jn
sono la parte aleatoria e si chiamano disturbi.
Notare che V
in
e V
jn
possono essere pensate come la media di U
in
ed
U
jn
rispettivamente.
Osservazione 1: E’ facile dimostrare che aggiungendo una costante
sia ad U
in
che a U
jn
non si modifica la probabilità di scelta.
Osservazione 2: Possiamo fare un’altra osservazione, procediamo a
riscrivere la probabilità che la persona n scelga l’alternativa i nel
seguente modo:
P
n
(i) = Pr(U
in
� U
jn
)
= Pr(V
in
+ e
in
� V
jn
+ e
jn
) (1.16)
= Pr(e
jn
-e
in
� V
in
– V
jn
)
Da ciò si evince che il valore assoluto di V e e non ci interessa ma
tutto ciò che ci preoccupa è che la differenza dei disturbi e sia minore
della differenza delle parti deterministiche della funzione d’utilità V.
1.3.2 Definizione della parte deterministica della funzione d’utilità.
Per ogni individuo n ogni alternativa i può essere caratterizzata da un
opportuno vettore degli attributi z
in
. Nel caso del lavoratore che deve
recarsi a lavoro z
in
potrebbe includere il tempo, costo, comfort,
convenienza e sicurezza. E’ necessario caratterizzare la persona n
che deve eseguire la scelta con un altro vettore degli attributi S
n
. Nel
nostro esempio questo vettore sarà costituito da variabili come il
reddito, numero di componenti della famiglia, età, occupazione, sesso
e così via.
Pagina 13
Avendo a che fare con due vettori degli attributi, z in e Sn, potrebbe
essere una buona idea definire un nuovo vettore degli attributi x che
includa sia z in e Sn. Rigorosamente possiamo scrivere:
xin = h(z in, Sn) xjn = h(z jn, Sn) (1.17)
dove con h(.) si indica una funzione vettoriale.
A seguito di questo si può procedere a riscrivere la componente
deterministica della nostra funzione d‘utilità nel seguente modo:
Vin = V(xin)
e (1.18)
Vjn = V(xjn)
A questo punto ci poniamo il seguente quesito: qual è la forma
migliore che noi possiamo dare alla funzione V?
Volendo avere una funzione che abbia delle proprietà di calcolo che
permettano di stimare facilmente i parametri dai quali essa dipende, in
molti casi è opportuno procedere a scegliere una funzione che sia
lineare rispetto ai parametri. Indichiamo con b = [β1,β2,…,βK]’
Vin = b1xin1+b2xin2+…+bkxink ,
(1.19)
Vjn = b1xjn1+b2xjn2+…+bkxjnk ,
Si nota immediatamente che entrambe le utilità hanno lo stesso
vettore dei parametri, però come si vedrà nel seguito questo è solo
una scelta notazionale, infatti definendo opportunamente i vari
elementi di x si può dare ad ogni funzione d’utilità dei coefficienti
differenti.
Notare che la linearità rispetto ai parametri non e’ equivalente alla
linearità rispetto a z in e Sn, in quanto la funzione h(.) che lega xin ai
vettori z in e Sn può essere non lineare.
Inoltre ci possiamo rendere conto che si è assunto che
b = [β1,β2,…,βK]’ sono uguali per tutti i membri del nostro campione.
Questa non è però una restrizione come potremmo pensare in quanto
Pagina 14
esiste la possibilità di suddividere la popolazione in gruppi ognuno dei
quali possieda un proprio vettore dei parametri.
1.3.3 Definizione della parte aleatoria della funzione d’utilità.
Abbiamo visto nel paragrafo 1.3.1 nella formula (1.16) che si possono
studiare i modelli di scelta binaria analizzando semplicemente la
differenza e
jn
– e
in
piuttosto che e
in
e e
jn
separatamente.
Procediamo ad analizzare il problema della media dei disturbi. Sempre
nel paragrafo (1.3.1) abbiamo accennato al fatto che la probabilità di
scelta non si modifica aggiungendo una costante sia ad U
in
che a U
jn
.
Supponiamo che la media del disturbo dell’alternativa i è maggiore di
una certa quantità di quella del disturbo dell’alternativa j, possiamo
dunque rappresentare la differenza dei due disturbi aggiungendo
questa quantità a V
in
.
Rigorosamente sia E[e
in
]= m
1
, E[e
jn
]=m
2
, si può porre:
e
in
=m
1
+e
in
e
jn
=m
2
+e
jn
(1.20)
e posto
Dm= m
1
-m
2
ove m
1
>m
2
(1.21)
sostituendo queste quantità nella formula (1.16)
P
n
(i) = Pr(e
jn
-e
in
� V
in
– V
jn
)
=Pr(e
jn
-e
in
� V
in
+Dm – V
jn
)
=Pr(e
jn
-e
in
� V
in
– V
jn
) ove V
in
= V
in
+Dm (1.22)
Ovvero si definisce un nuovo vettore dei parametri nel seguente
modo:
b’=[Dm , b’] e x
in
=[1 , V
in
]
e definendo:
V
in
= V
in
+Dm = b’ x
in
Da ciò segue che possiamo supporre che qualunque media diversa da
zero dei disturbi sia assorbita nella componente deterministica della
funzione d’utilità.
Pagina 15
Notiamo inoltre
P
n
(i) = Pr(U
in
� U
jn
) = Pr(V
in
+ e
in
� V
jn
+ e
jn
) (1.23)
= Pr (aV
in
+ ae
in
� aV
jn
+ ae
jn
) per qualsiasi a > 0
dunque non solo aggiungendo una costante sia a U
in
e U
jn
la
probabilità di scelta non risulta modificata ma anche moltiplicando
entrambe per una costante positiva questa non si modifica. Questo
viene fatto in modo da rendere V “unica”, bisogna cioè fissare la sua
scala, e generalmente ciò è fatto ponendo dei vincoli sui disturbi, per
esempio se noi vogliamo porre var[e
jn
-e
in
]=1 si ottiene dopo alcuni
semplici passaggi i seguenti risultati:
var[a(e
jn
-e
in
)]= a
2
var(e
jn
-e
in
) = 1 (1.24)
che implica
a =
21
1
/
)var(
injn
ee −
(1.25)
A questo punto sarà necessario trovare un’opportuna forma per la
distribuzione di e
in
,e
jn
, oppure per la loro differenza e
jn
-e
in
.
Analizziamo 3 tipi modelli di scelta binaria che si differenziano per il
tipo di distribuzioni scelte per i nostri disturbi.
1.3.3.1 Modelli con distribuzione di probabilità uniforme.
Il modo più semplice per sviluppare un modello è quello in cui la
differenza e
jn
-e
in
è uniformemente distribuita tra due valori fissi –L e L,
dove L>0, definiamo e
jn
-e
in
=e
n
e la sua funzione di densità di
probabilità come f(e
n
) così definita:
f(e
n
) =
−∈
altrimenti 0
se
n
1
],[ LL
L
e
(1.26)
Risolvendo P
n
(i), si ha
P
n
(i) = Pr(U
in
� U
jn
)
= Pr(V
in
+ e
in
� V
jn
+ e
jn
) (1.27)
= Pr(e
jn
-e
in
� V
in
– V
jn
) = Pr(e
n
� V
in
– V
jn
)