______________ Introduzione
5
L’assunto del Bacon esprime pienamente l’importanza della “conoscenza”: ai
nostri giorni tutto ciò che contribuisce ad arricchire il proprio sapere acquista un
valore rilevante. Soprattutto in ambito economico, un know-how, al passo coi
tempi ed in continua evoluzione, è un valore aggiunto per un’azienda,
permettendole di essere concorrenziale sul mercato.
Con il progredire della tecnologia cambia anche il modo di apprendere: il mondo
del Web è un esempio di come oggi sia più facile semplice reperire delle
informazioni, ma la vera frontiera è il Knowledge Discovery, ovvero l’insieme di
strategie che consentono di estrapolare informazioni utili da osservazioni
(campioni) su un ambiente o un caso reale. L’Intelligenza artificiale è allo studio
di metodi per automatizzare i processi di apprendimento (la percezione visiva, ad
esempio). Un approccio recente al Knowledge Discovery è il Data Mining, che
U.Fayyad, G.Piatetsky-Shapiro, P.Smyth, R.Uthurusamy (in "Advances in
knowledge discovery and data mining") definiscono come “non trivial process of
identifying valid, novel, potentially useful, and ultimately understandable patterns
in data”. Questa definizione evidenzia l'aspetto inferenziale del processo e la
capacità di far emergere la “conoscenza” dai dati senza richiedere la
formulazione di specifiche ipotesi a priori, come accade, invece, per l’Information
Retrieval. Il data mining offre di un approccio esplorativo e non, come nel data
retrieval, verificativo, evidenziando relazioni che non solo erano nascoste e
sconosciute, ma che spesso non si era nemmeno mai ipotizzato potessero esistere.
Sia il data mining che l’AI sono campi di ricerca presso l’Università degli Studi di
Salerno, con particolare riguardo all’elaborazione delle immagini e a sistemi di
tutoring intelligenti per gli ambienti di e-learning. Infatti ognuno dei paradigmi
dell’AI, classico o emergente, influenza in misura diversa i modi con cui
rappresentare i processi di apprendimento, le teorie conseguenti e in alcuni casi
alcuni aspetti delle pratiche didattiche, generando una vera e propria Tecnologia
Educativa. La tecnologia dell’e-learning, in espansione negli ultimi anni, attrae sia
aziende che università in quanto con il web e le nuove tecnologie (trasmissione
satellitare, per citarne una) si dispone di strumenti che consentono una formazione
flessibile, rapida e più idonea alle esigenze di un utente (un indubbio vantaggio è
la possibilità di fruire dei contenuti formativi a proprio piacimento, dove e quando
si vuole).
______________ Introduzione
6
Il presente lavoro è concentrato sulle Bayesian Network (reti Bayesiane), una
delle tecnologie emergenti di Intelligenza Artificiale. Con questi strutture, sinergia
di una rappresentazione grafica e probabilistica, è possibile modellare ed inferire
su problemi secondo un’analisi bottom-up, top-down ma anche seguendo schemi
direzionali diversi. In particolare, sono allo studio algoritmi di data mining per le
BN, in grado di ricostruire una rete Bayesiana da osservazioni campionarie su
una certa realtà: tale compito non è semplice ma i risultati ottenuti sono
soddisfacenti.
Gli obiettivi della tesi sono:
caratterizzare le reti Bayesiane (Capitolo 1);
analizzare l’apprendimento automatizzato di reti Bayesiane - learning from
data - secondo l’ottica Bayesiana (Capitolo 2), in particolare dello
structural learning (Capitolo 3);
visto che in letteratura non è stato proposto nessun algoritmo che
ricostruisca perfettamente una Bayesian Network si propone un approccio
diverso, utilizzato negli ultimi tempi in diverse aree: il multi - esperto
(ME) (Capitolo 4);
realizzare un tool in Java per sperimentare l’approccio (ME) (Capitolo 4).
Nell’appendice, infine, sono presenti alcuni richiami sulla teoria delle probabilità,
cenni sul test del chi quadro, ed approfondimenti sull’apprendimento delle reti
Bayesiane quali un elenco dettagliato dei software disponibili per la tecnologia
Bayesiana.
Capitolo 1 - Le reti Bayesiane
7
1 LE RETI BAYESIANE
1.1 INTRODUZIONE
L’esperto di genetica Sewall Wright, nel 1921, fu il primo a concepire una
rappresentazione grafica di modelli probabilistici per l’esemplificazione di un
problema.
Alla fine degli anni ’70, l’interesse per la Scienza della Cognizione e
l’Intelligenza Artificiale ha favorito lo sviluppo di modelli per rappresentare
relazioni di tipo probabilistico fra un insieme di variabili in condizioni di
incertezza: le Reti Bayesiane (BN - Bayesian Networks o Belief Networks, Belief
Bayesian Networks BBN).
La disponibilità di una rigorosa base probabilistica e della teoria dei grafi,
l’immediatezza dell’espressione grafica e la possibilità di realizzare un processo
di inferenza di tipo direzionale
1
ha condotto, infatti, ad una rapida affermazione
delle reti Bayesiane per la codifica della conoscenza, in condizioni di incertezza,
nei sistemi esperti, integrando o sostituendo i sistemi rule - based (così definiti
perché costruiti su un insieme di regole).
Le Belief Network sono una diretta rappresentazione di un dominio
2
e non del
processo di ragionamento: i legami rappresentati nel modello grafico esprimono
le reali connessioni fra le variabili e non il flusso del processo di ragionamento
(come avviene invece nei sistemi rule-based).
In ogni caso le BN consentono la comprensione di un problema complesso, anche
a persone non esperte, proprio grazie all’esplicazione dei legami fra le variabili.
[BUN96] [JEN96] [PEA200]
1
L’evidenza, in un processo di inferenza, è definita di tipo top – down (semantica, ovvero la
causa A implica l’effetto B ) e bottom – up (di percezione, ovvero quale è la causa che ha
provocato l’effetto B?).
2
Un dominio indica un insieme di variabili (aleatorie) con cui modellare un problema in
condizioni di incertezza.
Capitolo 1 - Le reti Bayesiane
8
1.2 PERCHÉ LE RETI BAYESIANE?
Il crescente interesse verso queste strutture ha coinvolto diverse aree di ricerca:
genetica, scienze sociali, statistica (in particolare i problemi con molte variabili),
teoria della decisione, intelligenza artificiale (per modellare sistemi intelligenti di
tipo probabilistico).
L’attenzione verso le Bayesian network è comprensibile perché:
• Le reti Bayesiane possono gestire velocemente insiemi incompleti di dati.
Per esempio, consideriamo un problema di regressione dove due delle
variabili di ingresso sono fortemente correlate. Se tutti gli ingressi fossero
osservati, questa correlazione non rappresenterebbe un problema per le
tecniche di apprendimento standard. Quando uno degli ingressi non è
osservato, la maggior parte dei modelli, invece, produce una predizione
non accurata mentre le reti Bayesiane offrono un modo naturale per
l’inferenza anche in assenza di dati completi
3
.
• Le reti Bayesiane permettono di apprendere le relazioni causali.
L'apprendimento delle relazioni causali è importante perché aumenta il
grado di comprensione del dominio di un problema e permette di fare
predizioni in merito a interventi futuri. Ad esempio, un analista di mercato
deve decidere se una campagna pubblicitaria influenza l’incremento della
vendita di un prodotto, ovvero bisogna determinare se la pubblicità
rappresenta una causa dell'incremento delle vendite. L'uso di reti
Bayesiane permette di risolvere problemi simili anche quando non è
disponibile nessun esperimento a riguardo.
• Le reti Bayesiane, in congiunzione con le tecniche statistiche di tipo
Bayesiano, facilitano l’associazione fra la rappresentazione del dominio, la
conoscenza a priori ed i dati. La conoscenza a priori del dominio è
importante, specialmente quando i dati sono scarsi o costosi. Nelle reti
Bayesiane, la semantica causale (rappresentazione grafica delle relazioni)
3
Ad esempio, la mancanza dei dati impedisce il processo di inferenza in un modello di regressione
lineare mentre una rete Bayesiana potrebbe essere fornita da un esperto. Diverso è il discorso
dell’apprendimento, learning, che verrà illustrato in seguito, in cui i missing values complicano
l’analisi delle BN.
Capitolo 1 - Le reti Bayesiane
9
e la possibilità di apprendere le probabilità condizionate rendono la
codifica della priori knowledge particolarmente chiara.
• I metodi Bayesiani, in congiunzione con le reti Bayesiane, offrono un
approccio efficiente per evitare l'overfitting
4
dei dati.
La ricerca, negli ultimi anni, è concentrata sullo sviluppo di metodi per
apprendere - learning - reti Bayesiane dai dati. Le tecniche sviluppate sono nuove
ed ancora in fase di studio ma i notevoli risultati ottenuti, in particolare per
applicazioni legate all’analisi dei dati, costituiscono un forte stimolo per i
ricercatori. [HEC94]
4
Il termine overfitting indica, in tale ambito, un’eccessiva dipendenza del modello probabilistico, o
di inferenza, dai dati in base ai quali è stato costruito.
Capitolo 1 - Le reti Bayesiane
10
1.3 BAYESIAN NETWORKS
Le reti Bayesiane (Bayesian Network, Belief Networks o Bayesian Belief
Networks – BN o BBN) sono un valido strumento per rappresentare un dominio in
condizioni di incertezza
5
. In particolare, si parla di Causal Probabilistic Networks
– CPN, quando le reti Bayesiane sono impiegate per evidenziare relazioni di tipo
causale all’interno del dominio.
Le Belief Network necessariamente non implicano un impiego dei metodi
Bayesiani; piuttosto l’aggettivo “Bayesiano” è legato all’utilizzo della regola di
Bayes per l'inferenza probabilistica
6
. Le probabilità codificate dalla rete Bayesiana
possono infatti essere “Bayesiane” se derivate dalla conoscenza a priori (fornite da
un esperto, ad esempio), “fisiche” quando l’apprendimento delle probabilità
avviene esclusivamente da un database di esempi (interpretazione frequentista).
1.3.1 L'APPROCCIO BAYESIANO ALLA PROBABILITÀ
Per comprendere le reti Bayesiane e le tecniche di apprendimento ad esse
associate, è importante delineare l'approccio Bayesiano alla probabilità e alla
statistica.
La probabilità Bayesiana
7
di un evento
8
x è espressa dal livello di fiducia che una
persona associa all'evento; quindi mentre la probabilità classica è una proprietà
fisica del mondo, basata sull’interpretazione frequentista, quella Bayesiana è una
proprietà della persona che assegna la probabilità all’evento. Per chiarire,
consegnando una moneta a qualcuno e chiedendogli di assegnare una probabilità
all’evento <<la moneta mostrerà ‘testa’ al prossimo lancio>>, questi,
verosimilmente, risponderà ½. Se, invece, si convincesse la persona che la moneta
è sbilanciata in favore di ‘testa’, egli assegnerebbe una probabilità più alta
5
L’incertezza è imputabile alla comprensione imperfetta o alla conoscenza incompleta del
dominio, alla casualità nel meccanismo che ne governa il comportamento ovvero ad una
combinazione di questi fattori.
6
L’inferenza probabilistica, in breve, determina quale sia la probabilità di un evento.
7
In onore del Reverendo Thomas Bayes, uno scienziato della metà del ‘700 che diede significativi
contributi alla teoria dell’inferenza probabilistica.
8
Alcune nozioni (evento, ad esempio) e assiomi della teoria della probabilità sono riportati, in
breve, nell’Appendice.
Capitolo 1 - Le reti Bayesiane
11
all’evento in base allo stato di conoscenza, ξ, acquisito. Per evidenziare
l’approccio Bayesiano alla probabilità, anziché indicare la probabilità dell’evento
x semplicemente come p(x), la si indica con p(x|ξ).
Un'importante differenza fra probabilità fisica e Bayesiana è che, per questa
ultima, non si ha bisogno di tentativi ripetuti. Un esempio è fornito da domande
del tipo: “che probabilità ha la Roma di vincere il campionato?” Lo statistico
classico dovrebbe rimanere in silenzio, mentre il Bayesiano potrebbe assegnare
una probabilità che rispecchi il proprio grado di conoscenza (ad esempio se la
Roma ha giocatori migliori rispetto alle altre squadre e agli anni precedenti).
Una critica comune alla definizione Bayesiana della probabilità è l’arbitrarietà:
perché il grado di fiducia dovrebbe rispettare le regole della probabilità? Con
quali valori la probabilità potrebbe essere stimata? O meglio, ha senso assegnare
una probabilità di uno (zero) ad un evento che (non) occorrerà e quale probabilità
assegnare ai livelli di fiducia che non sono né l’evento certo né l’evento
impossibile? Queste argomentazioni sono state oggetto di studio: molti ricercatori,
sostenitori dell’approccio Bayesiano
9
, hanno ricavato e dimostrato differenti
proprietà che conducono, comunque, alle regole della probabilità.
Il processo di stima del livello di fiducia con cui esprimere la probabilità secondo
l’approccio Bayesiano è noto come probability assessment: una tecnica molto
semplice è la seguente. Si consideri una ruota con solo due regioni (ombra e non
ombra), come quella illustrata in Figura 1. Assumendo che tutte le caratteristiche
della ruota siano simmetriche (eccetto che per la zona in ombra), si conclude che
la ruota ha uguale probabilità di trovarsi in qualsiasi posizione. Da questo giudizio
e dalla regola della somma della probabilità, segue che la possibilità che la ruota
si fermi nella regione “ombra” è uguale alla percentuale dell'area della ruota che è
in ombra (0.3 per la ruota in figura). Questo approccio fornisce un riferimento per
la misura delle probabilità relative ad altri eventi, associando, ad esempio, la zona
in ombra al risultato che si prospetta essere il meno probabile.
9
In tale proposito è opportuno osservare che l’approccio probabilistico ad un problema è un
argomento ampiamente discusso in letteratura: in sintesi, nessun approccio rappresenta il “modello
migliore” in assoluto ma può, invece, rappresentare la soluzione più adatta per un particolare
problema.
Capitolo 1 - Le reti Bayesiane
12
Figura 1 – Probability assessment
Un problema del probability assessment è la precisione: può una persona
realmente indicare che la probabilità per un evento è 0.601 e non 0.599? In molti
casi, no. D’altronde le probabilità spesso sono usate per prendere decisioni, quindi
si usano tecniche di analisi di sensitività per stabilire il grado di precisione
necessario. Un altro problema con il probability assessment è l'accuratezza, in
quanto il modo con cui si pone una domanda può condurre ad assessment che non
riflettono il reale livello di fiducia di una persona. [HEC94][HEC95]
Le probabilità quantificano l’incertezza associata al dominio codificato da una
rete Bayesiana; l’aspetto qualitativo, il modello grafico, agevola l’interpretazione
dei legami causali fra le variabili. Seguono, quindi, alcuni cenni sulla teoria dei
grafi.
1.3.2 I MODELLI GRAFICI E CENNI ALLA TEORIA DEI GRAFI
I modelli grafici forniscono un'interfaccia intuitiva per modellare insiemi di
variabili in condizioni di incertezza. Il fondamento dell'idea del modello grafico è
la nozione di modularità: un sistema complesso è sviluppato unendo parti più
semplici. La rappresentazione grafica costituisce la sintassi di un modello grafico
mentre la semantica è espressa dalla teoria delle probabilità.
Un modello grafico è costituito da K = {1, 2, …, k} variabili (o nodi o vertici)
con un insieme E di dipendenze (o collegamenti o link o archi) fra le variabili e
un insieme P di funzioni distribuzione di probabilità per ogni variabile. Se due
vertici (X
i
, X
j
) in un collegamento sono ordinati, allora si ha un arco orientato, in
cui si esplicita la direzione (X
i
→ X
j
o X
i
← X
j
). Un grafo orientato è
caratterizzato dall’avere tutti gli archi orientati. I grafi possono essere orientati,
non orientati o parzialmente orientati.
Capitolo 1 - Le reti Bayesiane
13
Nei grafi non orientati la nozione di indipendenza è semplice: due nodi A e B
sono condizionalmente indipendenti dati un terzo insieme C, se tutti i percorsi fra
i nodi in A ed in B sono separati dal nodo C; nei grafi orientati la definizione di
indipendenza deve considerare anche la direzione degli archi. I modelli orientati,
presentano svariati vantaggi, quello più importante è l’opportunità di considerare
un arco da A verso B come la codifica dell’asserto “A causa B”.
Una catena è una serie di nodi in cui ogni nodo è collegato al precedente (non ha
importanza la direzione del link); un path è una catena in cui l’arco ha sempre la
stessa direzione, ad esempio X
1
→ … → X
i
→ … → X
k
. Un ciclo è un percorso
(path) che inizia e termina nello stesso nodo. Un grafo aciclico orientato, DAG
(Direct Acyclic Graph), è un grafico orientato che non ha cicli. Una relazione
padre/figlio si presenta quando vi è un collegamento del tipo X
1
→ X
2
(da X
1
a
X
2
) dove X
1
è padre di X
2
o, viceversa, X
2
è figlio di X
1
. Una relazione
antenato/discendente è un’estensione della relazione padre-figlio. Un grafo è detto
completo se ogni nodo è connesso a tutti gli altri senza esplicitare alcuna
direzione; si definisce clique (gruppo di oggetti) un sottoinsieme di nodi completo
e che se ampliato, ad esempio con l’aggiunta di un nodo, perde la proprietà di
completezza. [STE00]
Figura 2 - A è padre di B, B è il padre di C e D. A è antenato di B,C,D,E,F.
Un possibile clique è A-B: difatti se aggiungessimo un nodo il grafo non sarebbe completo
Capitolo 1 - Le reti Bayesiane
14
1.3.3 DEFINIZIONE DI RETE BAYESIANA
Una rete Bayesiana è un grafico aciclico orientato (directed acyclic graph – DAG
- ovvero tutti i percorsi sono orientati e non ci sono cicli) costituito dalla coppia
(S,P):
1. S (rappresentazione qualitativa) - una struttura di rete che codifica
− con dei nodi, le variabili casuali discrete (con un numero finito di
stati) o continue (ad esempio con distribuzione gaussiana) del
dominio X = {X
1
,X
2
,…, X
N
};
− con degli archi orientati fra i nodi, l’insieme di asserzioni di
indipendenza condizionata relative ad X;
2. P (rappresentazione quantitativa) - un insieme di distribuzioni di
probabilità locali associate ad ogni variabile.
Figura 3 Relazione padre-figlio in una rete Bayesiana
La distribuzione di probabilità congiunta del dominio X = {X
1
,X
2
,…, X
N
} assume
quindi la seguente espressione:
p(X) =
∏
=
N
i 1
p(X
i
| padri(X
i
))
I rami che collegano i nodi rappresentano le dipendenze causali fra le variabili. La
semantica probabilistica espressa da queste strutture consente di quantificare
queste dipendenze con la CPT di una variabile, dati i suoi padri. Nel caso di
variabile discreta, ogni cella della CPT di un nodo esprime la probabilità
Capitolo 1 - Le reti Bayesiane
15
condizionata per lo stato di una variabile assegnata una configurazione
10
dei padri:
il numero di celle in una CPT per un nodo discreto uguaglia il prodotto fra il
numero di valori (stati) assunti dalla variabile e il prodotto del numero degli stati
dei padri
11
. Se un nodo non ha padre (nessun collegamento punta ad esso), il nodo
conterrà una tabella di probabilità marginale.
Nel caso di variabili continue si definisce la funzione di probabilità condizionata
(CPF), in genere di tipo gaussiano, e si associano al nodo parametri quali media e
varianza che identificano la CPF. [HEC94][JEN96][BUN96][KRA98][STE00]
1.3.4 UN ESEMPIO
“Un giorno il signor Fletcher scopre che il suo albero di mele migliore perde le
foglie e vuole capire perché ciò sta accadendo. Egli sa che se l’albero è secco (a
causa della siccità) non c’è nessun mistero da svelare – è normale la perdita di
foglie durante un periodo di siccità. D’altro canto l’albero potrebbe essere
malato”.
La situazione è modellata dalla BN in figura che consiste di tre nodi: Sick
(malato), Dry (secco), and Loses (perdite), i quali possono tutti presentarsi in uno
di due stati: Sick può essere "sick" o "not" - Dry può essere "dry" o "not" - e
Loses può essere "yes" o "no". Il nodo Sick ci dice che l’albero è malato essendo
nello stato "sick", altrimenti sarà nello stato "not". I nodi Dry e Loses,
rispettivamente, ci dicono se l’albero è secco o sta perdendo le foglie.
Figura 4 - Rete Bayesiana che rappresenta il dominio del problema
10
A sua volta un nodo padre assume più valori (stati) e quindi una configurazione rappresenta un
insieme dei possibili assegnazioni dei padri.
11
Ad esempio, date tre variabili binarie (con due stati) A, B, C con A e B padri di C, le possibili
configurazioni dei padri sono 4 mentre la CPT di C ha 8 celle.
Capitolo 1 - Le reti Bayesiane
16
Bisogna fare attenzione quando si modellano le dipendenze causali in una BN:
talvolta non è abbastanza ovvio in quale direzione un collegamento debba puntare.
Nel nostro esempio asseriamo che c’è una dipendenza causale da Sick a Loses
perché quando un albero è secco potrebbe perdere le foglie. Ma non potremmo
dire che quando l’albero perde le foglie, potrebbe essere secco e quindi disegnare
il collegamento in senso opposto? No, in quanto è l’aridità che causa la perdita
delle foglie e non viceversa. La figura precedente illustra la rappresentazione
qualitativa della BN. Per poter definire una rete Bayesiana dobbiamo specificare
anche la rappresentazione quantitativa, ovvero l’insieme delle CPT dei nodi.
[HUG]
Si osservi che tutte le tre tabelle mostrano la probabilità di un nodo di essere in
uno specifico stato in dipendenza di una configurazione degli stati dei nodi padri;
Sick e Dry non hanno nodi padri.
Dry="dry" Dry="not"
Sick="sick" Sick="not" Sick="sick" Sick="not"
Loses="yes" 0.95 0.85 0.90 0.02
Loses="no" 0.05 0.15 0.10 0.98
Sick="sick" Sick="not"
0.1 0.9
Dry="dry" Dry="not"
0.1 0.9
Capitolo 1 - Le reti Bayesiane
17
1.4 L’INFERENZA NELLE RETI BAYESIANE
1.4.1 L’INFERENZA STATISTICA
L’inferenza, in filosofia, indica un procedimento logico che permette di trarre una
conclusione da determinate premesse. Allo stesso modo lo scopo dell’inferenza
statistica è di estrarre un modello che consenta di trarre delle opportune
conclusioni sull’andamento di una popolazione statistica (insieme di unità,
individui, oggetti o altri enti in cui si manifesta il fenomeno che si studia). La
conoscenza delle caratteristiche di un’intera popolazione spesso non è consentita
sia per motivi di tempo che economici, quindi l’efficacia del processo di inferenza
è nell’estendere a tutta la popolazione i risultati ottenuti su un campione limitato.
Un fenomeno viene rappresentato da un modello teorico o dalle caratteristiche di
una popolazione; a partire dal modello la teoria della probabilità consente di
prevedere il comportamento potenziale dei dati (problema diretto o deduttivo).
Tutto ciò è la premessa necessaria per poter percorrere il cammino inverso: dai
dati di un determinato campione si perviene al modello teorico (problema inverso
o induttivo). L’inferenza rappresenta l’insieme dei metodi con cui si risolve il
problema inverso.
Figura 5 Problema diretto e problema inverso
Capitolo 1 - Le reti Bayesiane
18
1.4.2 I DIVERSI APPROCCI ALL’INFERENZA STATISTICA
I vari approcci all’inferenza statistica differiscono sia nella concezione stessa di
inferenza che nelle singole tecniche di risoluzione dei problemi. Le diversità sono
in parte legate ad interpretazioni differenti del concetto di probabilità e, in parte,
sono dovute al tipo di obiettivi dell’inferenza statistica. Schematizzando, si può
dire che tre sono gli approcci fondamentali.
1.4.2.1 CLASSICO
L’approccio classico, legato ai nomi di R. A. Fisher, J. Neyman, E.S. Pearson ed
altri, include le tecniche, della stima puntuale e per intervallo, della verifica delle
ipotesi, sviluppate a partire dalle distribuzioni campionarie delle statistiche. La
concezione della probabilità è quella frequentista.. Il termine “classico” si
giustifica con il fatto che i principi ed i metodi che lo caratterizzano sono
ampliamente applicati e hanno preceduto (in termini, soprattutto, di sviluppo
formale) dal punto di vista cronologico gli altri approcci.
1.4.2.2 BAYESIANO
L’inferenza Bayesiana, come quella classica, si articola nelle procedure di stima
dei parametri e di verifica delle ipotesi, ma, a differenza di questa, utilizza nel
processo di induzione, assieme ai dati del campione, le informazioni a priori. Le
informazioni a priori vengono modificate dai dati del campione attraverso l’uso
del teorema di Bayes, ovvero utilizzando lo stato di conoscenza. Questa
impostazione non può basarsi unicamente su una visione frequentista delle
probabilità; è inevitabile una interpretazione soggettivista.
1.4.2.3 TEORIA DELLE DECISIONI
La teoria delle decisioni è stata avviata dal lavoro di Wald (1950). L’obiettivo di
questa impostazione è quello di stabilire delle regole di azione in situazioni di
incertezza: le regole di decisione. In sintesi, il nucleo fondamentale consiste nella
valutazione delle conseguenze di decisioni alternative espresse in termini di
perdita o funzioni di perdita.