IV
selezionato un equilibrio. Assumendo un gioco condotto molte volte da
giocatori limitatamente razionali e casualmente estratti da grandi popolazioni,
la teoria evolutiva dei giochi analizza la distribuzione nel tempo dei
comportamenti (strategie) nella popolazione e ne verifica la stabilità, ovvero la
robustezza rispetto ad eventuali scostamenti. Si tratta di giocatori limitatamente
razionali in quanto non intraprendono una strategia dopo un complesso
ragionamento; piuttosto “adattano” il proprio comportamento in base al suo
successo relativo. Quest’ultimo, misurato dalla differenza tra il payoff
associato a tale strategia e il payoff medio ottenuto dall’intera popolazione,
dipende dall’ambiente strategico in cui si opera, ovvero dalla distribuzione
“corrente” delle diverse strategie nella popolazione dei giocatori.
Nello sviluppo della teoria evolutiva dei giochi, una prima e fondamentale
tappa consiste nell’individuazione delle strategie evolutivamente stabili
1
, tali
cioè da non poter essere migliorate da nessuna strategia alternativa (Maynard
Smith 1973 e 1982). I giocatori scelgono la strategia evolutivamente stabile
(ESS) poiché conferisce loro il payoff atteso più alto; qualunque giocatore che
se ne discostasse otterrebbe uno “svantaggio riproduttivo”, misurato dalla
differenza tra i payoff attesi. Non ci saranno dunque comportamenti devianti ed
il profilo di strategie evolutivamente stabili finirà per dominare la popolazione.
Il criterio di stabilità evolutiva suggerito dal concetto di ESS, sebbene sia
decisamente più stringente rispetto ai criteri proposti dai tradizionali
refinements, presenta diverse debolezze, in particolare con riferimento ai giochi
asimmetrici (in cui sono presenti due popolazioni distinte)
2
e riguardo alla
mancata investigazione dei processi che conducono all’equilibrio
evolutivamente stabile.
La dinamica dei replicatori, la cui formulazione matematica è dovuta a Taylor
e Jonker (1978), evidenzia come una popolazione arrivi ad adottare un certo
tipo di comportamento e permette dunque di colmare gran parte dei limiti delle
ESS.
3
I replicatori sono le strategie pure del gioco, la cui diffusione all’interno
1
Le strategie evolutivamente stabili (ESS) vengono affrontate nel primo capitolo.
2
Si veda il paragrafo 1.5.
3
I modelli di dinamica dei replicatori con popolazione omogenea o popolazioni multiple sono
esaminati nel secondo capitolo. Nei capitoli terzo, quarto e quinto si è proceduto ad
V
della popolazione di riferimento è strettamente legata al “vantaggio
riproduttivo”(o fitness) da esse conferito, inteso come differenza tra il payoff
corrente della strategia ed il payoff medio nella popolazione. Quanto più
elevato è il payoff corrente (relativo allo stato della popolazione corrente) di
una generica strategia i rispetto alla “media”, tanto più elevato è il vantaggio
riproduttivo da essa conseguito e dunque il numero di copie di sé stesso create.
Analogamente al processo evolutivo che avviene in natura, la dinamica dei
replicatori specifica come le quote della popolazione associate alle diverse
strategie pure nel gioco evolvano nel tempo. Essendo formalizzato in un
sistema di n equazioni differenziali (una per ogni replicatore), tale strumento
determina verso quale stato limite convergerà la popolazione, a partire da
diverse condizioni iniziali. La determinazione degli stati asintoticamente
stabili di un gioco permette di individuare la convenzione che si andrà ad
affermare nella popolazione di riferimento. Da un punto di vista matematico, è
possibile stabilire le condizioni, verificate le quali, la dinamica di un
determinato sistema converge verso uno stato stabile piuttosto che un altro. Ciò
rappresenta un eccezionale contributo nella risoluzione del problema di
indeterminatezza e consente di definire gli strumenti attraverso i quali
influenzare e facilitare il raggiungimento dell’equilibrio ottimale o socialmente
efficiente.
Nel presente lavoro, dopo aver definito gli aspetti teorici della dinamica dei
replicatori, abbiamo proceduto ad applicazioni con riferimento a diverse
situazioni di interazione strategica tra agenti. Nell’ambito delle problematiche
ambientali, abbiamo studiato il sistema dinamico inerente l’adesione dei
comuni, appartenenti ad un bacino idrografico, ad un programma di raccolta
differenziata a domicilio, evidenziando l’importanza della partecipazione e
disponibilità dei cittadini per la convergenza verso l’equilibrio socialmente
efficiente. Quando tale propensione è sufficientemente elevata, i comuni sono
incentivati a promuovere l’iniziativa, anche unilateralmente. L’asimmetria
applicazioni con riferimento rispettivamente a problematiche ambientali, alle strategie delle
imprese ed al comportamento dei contribuenti.
VI
nell’etica ambientale e nel volume medio di rifiuti prodotti dai cittadini delle
due zone (parti costituenti di un bacino o di una regione) può comportare la
nascita di una convenzione discriminatoria, secondo la quale solo i comuni
meno inquinanti adottano il sistema di raccolta differenziata “porta a porta”.
Ciò deriva dal fatto che i comuni che producono un volume medio di rifiuti
inferiore agli altri sono anche quelli particolarmente sensibili alle
problematiche ambientali e ben disposti dunque ad impegnarsi per la rimozione
del problema rifiuti. Tuttavia, tale risultato è possibile solo nel caso in cui il
costo totale sostenuto dai comuni più inquinanti per la promozione unilaterale
dell’iniziativa superi in valore assoluto l’entità del danno ambientale subito
dagli stessi.
4
In caso contrario, c’è la possibilità di raggiungere un risultato più
“equo”, nel senso che promuovono ed attivano la raccolta differenziata i soli
comuni più inquinanti e meno sensibili alle questioni ambientali.
5
Considerando la disponibilità e sensibilità ambientale dei cittadini di una zona
come conseguenza della rilevanza del problema dell’inquinamento da rifiuti, è
possibile raggiungere l’equilibrio socialmente efficiente in cui tutti i comuni
cooperano nella realizzazione di un sistema integrato di raccolta differenziata.
6
Ciò sta a significare che la gravità e l’emergenza del problema
dell’inquinamento da rifiuti in una zona possono avere un effetto trainante
anche per gli altri comuni.
Sempre in ambito ambientale abbiamo analizzato le condizioni che rendono
possibile una crescita del reddito nel lungo periodo, accompagnata dalla
conservazione del bene ambiente (una crescita sostenibile). Grazie alla teoria
evolutiva dei giochi abbiamo introdotto nelle usuali funzioni di produzione
l’interazione strategica ricorrente tra agenti, così da analizzare l’andamento
dinamico nel tempo dei fattori produttivi, partendo da diverse condizioni
iniziali. Assumendo una popolazione omogenea di agenti chiamati a scegliere
il livello di sfruttamento economico di una risorsa ambientale tra due possibili
4
Si veda il quarto e quinto caso del gioco della raccolta differenziata, discusso nel paragrafo
3.3.
5
Posto che la differenza tra i volumi medi di rifiuti sia sufficientemente grande.
6
Anche in questo caso devono essere soddisfatte determinate condizioni, in particolare
riguardo alla differenza tra i volumi medi di rifiuti ed al grado di inquinamento già presente
nell’area.
VII
alternative (elevato,
h
P , e basso, comunque positivo,
b
P )
7
, abbiamo studiato il
sistema dinamico costituito dalla variazione del capitale procapite e dello
sfruttamento ambientale.
8
In una funzione di produzione che non considera
l’input tecnologico, la crescita economica sostenibile può esistere solo nel
breve termine (ciò è dovuto ai rendimenti marginali decrescenti del capitale).
Includendo la tecnologia, trattata come variabile costante, si è rilevata la
possibilità di una crescita del reddito sostenibile nel lungo periodo; tuttavia
solo nell’ambito di un modello di crescita endogena (in cui i rendimenti
marginali del capitale sono costanti) e di uno standard minimo di sfruttamento
(
b
P ) sufficientemente elevato da garantire la crescita indefinita del capitale
anche quando tutti i giocatori adottano tale strategia.
9
Laddove ciò non fosse
verificato, la crescita sostenibile può comunque esistere, ma solo in
corrispondenza del massimo sfruttamento ambientale (tutti i giocatori scelgono
h
P ). Tale risultato paradossale, dovuto alla definizione di sostenibilità come
costanza del flusso economico di sfruttamento ambientale, si ridimensiona
considerando l’eventuale esauribilità della risorsa ambientale. Introducendo
tale ipotesi, infatti, il capitale ed il reddito procapite non potrebbero
sperimentare all’infinito tassi di crescita positivi.
Considerando un miglioramento tecnologico á la Hicks derivante da uno shock
esterno, si sono rilevati effetti differenti a seconda delle condizioni iniziali di
sviluppo di un’economia. Un’economia in via di sviluppo (bassi livelli di
capitale procapite) ha maggiori possibilità di raggiungere la crescita sostenibile
in corrispondenza del minimo sfruttamento ambientale, mentre un’economia
sviluppata può conseguire una crescita sostenibile solo in corrispondenza del
massimo sfruttamento ambientale. Tale risultato è apparentemente paradossale,
in quanto ci saremmo aspettati che fossero le economie fortemente sviluppate a
7
Si può pensare a due giocatori che pongono in essere attività economiche in concorrenza tra
loro e che devono decidere la misura di sfruttamento delle risorse ambientali a loro
disposizione.
8
Si veda il paragrafo 3.4.
9
Rigorosamente,
Ζ
b
P >
sA
n Γ
. Stiamo implicitamente affermando che anche il livello più basso
di sfruttamento ambientale è comunque sufficientemente elevato. Ciò potrebbe derivare dalle
caratteristiche tecniche o di estrazione della risorsa che ne impediscono un consumo inferiore.
VIII
potersi “permettere” di sfruttare meno l’ambiente rispetto alle economie in via
di sviluppo. Al di là delle ragioni tecniche del risultato, derivanti dall’entità del
reddito procapite di cui i giocatori possono appropriarsi, dobbiamo considerare
che un Paese in via di sviluppo non presenta i costi di riconversione
dell’apparato industriale a seguito di un miglioramento tecnologico, che può
dunque spingere con più facilità verso un minore sfruttamento ambientale.
10
Senza contare che, in realtà, i Paesi maggiormente inquinanti sono quelli più
sviluppati; il “lusso” che possono concedersi allora non è quello di non
sfruttare affatto l’ambiente (o di farlo in maniera limitata) bensì di sfruttarlo
costantemente, seppur ad un livello elevato.
11
Tuttavia, il modello non esclude la possibilità che anche un Paese in via di
sviluppo si muova verso la crescita sostenibile col massimo sfruttamento
ambientale. Tale situazione si verifica in corrispondenza di una scarsa etica
ambientale che sembra dunque essere particolarmente rilevante, ai fini dello
sfruttamento ambientale, per un’economia poco sviluppata.
Nonostante si tenda a vedere il progresso tecnologico come un “sostituto”
dell’impiego di risorse naturali, dalle assunzioni del nostro modello ne
discende una tendenza netta alla scelta dell’alto sfruttamento ambientale: il
reddito procapite che i giocatori possono ottenere in corrispondenza di un
avanzamento tecnologico è infatti più elevato e, conseguentemente, è
rafforzato l’incentivo all’adozione della strategia aggressiva.
12
Quest’effetto
può essere tuttavia contrastato dal peggioramento dell’entropia esistente nel
sistema (causato dall’eccessivo sfruttamento della risorsa naturale) che
comporta un miglioramento delle possibilità di conseguire la crescita
sostenibile col livello minimo di sfruttamento ambientale.
Una seconda applicazione della teoria evolutiva dei giochi ha riguardato le
scelte strategiche delle imprese. Il risultato cui siamo pervenuti è che la
10
Al contrario, un’economia fortemente sviluppata va incontro a maggiori costi di
riconversione dell’apparato industriale.
11
E’ proprio questa la ragione dell’eccessivo inquinamento prodotto dai Paesi più sviluppati.
12
Stiamo dunque sottolineando un possibile ruolo negativo del progresso tecnologico ai fini
dell’ottenimento del minimo sfruttamento ambientale. Tuttavia, si tratta di un progresso
tecnologico che incrementa indifferentemente la produttività di tutti i fattori della produzione,
ivi compreso l’input naturale. La maggiore produttività della risorsa ambientale incentiva i
giocatori allo sfruttamento.
IX
dinamica dei replicatori è in grado di eliminare tutte le strategie strettamente
dominate (nonché quelle iterativamente dominate), senza assumere giocatori
perfettamente razionali.
13
Nel gioco esemplificativo di un duopolio alla
Bertrand, infatti, la strategia che comporta la scelta di un prezzo elevato tende a
scomparire dalla popolazione di imprese, che finiranno tutte per scegliere un
prezzo basso, confermando il risultato dell’interazione simultanea e statica tra
imprese secondo il modello originario.
14
Non è detto invece che una strategia debolmente dominata venga
necessariamente eliminata dalla pressione della “selezione naturale”.
Introducendo la dinamica dei replicatori in un gioco relativo all’eventuale
reazione delle imprese esistenti in un mercato all’entrata di un potenziale
concorrente, abbiamo potuto rilevare la presenza di un equilibrio in cui nessuna
impresa esterna decide di entrare e, nonostante ciò, una frazione positiva delle
imprese già insediate decida di reagire.
15
Tale risultato, che si basa di fatto sulla
minaccia non credibile delle imprese esistenti di reagire all’entrata, è tuttavia
possibile perché la piccola quota iniziale di imprese potenziali entranti che
decidono di concretizzare la scelta si azzera prima che, nella popolazione
avversaria, la quota della strategia accomodante superi quella della strategia
aggressiva. Si tratta dunque di uno stato stazionario, che la dinamica del gioco
raggiunge solo partendo da particolari configurazioni iniziali.
Lo strumento della dinamica dei replicatori è stato poi da noi utilizzato per
analizzare l’evoluzione delle conoscenze tecnologiche di un Paese,
conseguente all’investimento in R&S da parte delle imprese.
16
Assumendo una
sostituibilità tra le risorse dirette alla R&S e quelle destinate alla produzione
attuale di beni, l’incentivo per le imprese a promuovere attività di ricerca è
strettamente legato allo stock di conoscenze tecnologiche accumulato in
passato; maggiore è la ricchezza culturale e tecnologica di un Paese, maggiore
è “l’efficienza” dell’investimento in R&S (la ricerca parte infatti da una base
13
Ciò, da un lato, esalta il concetto di equilibrio di Nash, permettendo di apprezzarne
ulteriormente la straordinarietà, dall’altro consente di superare gran parte dei limiti di un
approccio razionalistico alla teoria dei giochi.
14
Si veda il paragrafo 4.1.
15
Si veda il paragrafo 4.2.
16
Si veda il paragrafo 4.3.
X
tecnologica più ampia). Dall’analisi del sistema dinamico, costituito dal
capitale tecnologico e dalla frazione di imprese che scelgono di investire
maggiori risorse nella R&S rispetto alla produzione attuale dei beni, abbiamo
rilevato la presenza di un trade-off tra crescita economica e produttiva corrente
e progresso tecnologico o crescita economica nel lungo termine. Secondo le
assunzioni ed implicazioni del nostro modello, il fatto che un’economia non
sperimenti oggi elevati tassi di crescita della produzione e dei consumi non
deriva necessariamente dalla sua arretratezza, ma potrebbe voler dire che una
parte significativa delle risorse del Paese confluisce nell’arricchimento
tecnologico. Nel lungo termine l’economia potrà sperimentare tassi di crescita
superiori a quelli di un altro Paese, nei confronti del quale partiva
apparentemente svantaggiata.
Infine, abbiamo utilizzato la teoria evolutiva dei giochi per studiare il
comportamento strategico dei contribuenti.
17
Il problema che ci siamo posti è
stato quello di stabilire fino a che punto ed in quali casi la disapprovazione
sociale della comunità nei confronti dell’evasore fiscale possa incentivare i
contribuenti a pagare le tasse. Il risultato più importante cui siamo giunti è che
l’equilibrio socialmente efficiente (in cui tutti i giocatori pagano le tasse) è
raggiungibile, nonostante i contribuenti ritengano particolarmente bassa la
probabilità di subire un controllo fiscale. Questo è possibile solo se
l’approvazione della comunità è sufficientemente importante per tutti i
giocatori. La presenza di una sanzione sociale sopperisce in qualche modo
all’aspettativa di una scarsa quantità di controlli fiscali. L’equilibrio ottimale,
in cui tutti erogano effettivamente il proprio contributo, ha così il significato di
norma sociale (o regola di comportamento) che si rafforza e mantiene nel
tempo.
17
L’argomento è sviluppato nel capitolo 5.
1
PARTE PRIMA: TEORIA
CAPITOLO 1: Dai perfezionamenti degli equilibri di Nash alle
strategie evolutivamente stabili
1.1 Introduzione
La grande utilità della teoria dei giochi è indubbiamente la sua valenza
generale, la sua applicabilità in diverse discipline. Del resto, per gioco si
intende un qualsiasi modello stilizzato che descrive situazioni di interazione
strategica tra agenti, situazioni cioè dove il risultato ottenuto da ciascun agente
dipende non solo dalle sue azioni ma anche dalle azioni di tutti gli altri.
Dato che la vita di tutti noi è densa di situazioni di questo tipo, possiamo
percepire la forza del concetto di equilibrio di Nash, che è la previsione di
come sarà giocato “naturalmente” il gioco.
18
Da sempre l’attenzione degli
studiosi si è focalizzata su quei giochi che presentano molteplici equilibri di
Nash. Nonostante questo problema di indeterminatezza, la teoria dei giochi ed
il meritevole lavoro di John Nash non perdono di attrattiva in quanto è
possibile individuare, tra i vari equilibri, quello che si distingue dagli altri come
la soluzione obbligata del gioco, la convenzione su come il gioco verrà
giocato, che si andrà effettivamente ad affermare. Come facciamo a selezionare
quest’equilibrio? Il problema è al centro di un programma di ricerca nato negli
anni ’70 del secolo scorso noto come refinements dell’equilibrio di Nash.
L’obiettivo è quello di raffinare tale concetto e liberarsi da quegli equilibri di
Nash che si presentano fragili, implausibili, irragionevoli alla luce di
considerazioni basate sulla condotta “razionale” degli agenti. Tra i contributi
18
Si ricorda che una coppia di strategie soddisfa la condizione di equilibrio di Nash se le
strategie dei giocatori sono reciprocamente risposte ottime (best reply); ovvero la strategia di
ogni giocatore dev’essere la risposta ottima alla strategia dell’altro. E’ una condizione di
equilibrio in quanto nessun giocatore ha un incentivo unilaterale a discostarsi, a deviare da tale
strategia che è la miglior risposta alle strategie degli altri; ciò vuol dire che, se adottasse una
qualunque altra strategia, otterrebbe un payoff inferiore.
2
più interessanti di tale indagine (dal punto di vista dei possibili legami con la
nozione di ESS), ricordiamo il concetto di trembling hand perfection (Selten,
1975), di equilibrio appropriato (Myerson, 1978) e di equilibrio sequenziale
(Kreps e Wilson, 1982). Il primo, che allude alla possibilità (anche piccola) che
i giocatori commettano un errore nella scelta della best reply, concepisce
l’equilibrio perfetto come quella combinazione di strategie che resiste ad
eventuali errori involontari dei giocatori. Il criterio di robustezza degli EN
proposto da Myerson è leggermente più stringente: un equilibrio è appropriato
se resiste a possibili errori dei giocatori, dove la probabilità di commettere un
errore dipende dalle sue conseguenze economiche (quanto più “costoso” è
l’errore tanto minore sarà la probabilità che questo si verifichi). Il concetto di
equilibrio sequenziale infine ha, per i giochi in forma estesa, lo stesso effetto
della trembling hand perfection nei giochi in forma normale: eliminare gli EN
che hanno come componente una strategia dominata e perciò non plausibili
come soluzioni del gioco (più precisamente si tratta di scartare gli equilibri
basati su minacce non credibili dei giocatori).
Rimuovendo gli equilibri pericolanti, rimarrà quello robusto ovvero la
soluzione effettiva del gioco. Le spiegazioni dei processi di selezione generate
nell’ambito dei refinements dell’equilibrio di Nash, si sono rilevate spesso
artificiose e forzate: si sono aggiunti vincoli o specificazioni addizionali alla
razionalità del calcolo strategico degli individui, allontanandosi sempre più
dalle loro capacità “naturali” di ragionamento.
19
Esistono così tanti
raffinamenti della nozione di equilibrio di Nash che in molti giochi che
presentano EN multipli, ogni equilibrio può essere “giustificato” da qualche
raffinamento presente in letteratura.
Un contributo più “convincente” al problema dell’indeterminatezza ci viene
fornito dal concetto di ESS (Evolutionarily Stable Strategies), prima e
fondamentale tappa del percorso che ha portato negli anni allo sviluppo di una
teoria evolutiva dei giochi.
19
L’idea di fondo del perfezionamento di Myerson è di considerare agenti che possano
commettere degli errori, ma che in tali errori ci sia comunque un elemento di razionalità. Si
ammette cioè la possibilità che i giocatori si sbaglino seppur razionalmente in funzione dei
costi che possono derivare da tali errori.