Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
5
Introduzione
La metafora del World Wide Web e della ragnatela calza perfettamente con ciò che è il
web attuale, che tutti noi utilizziamo: un insieme di risorse ipertestuali collegate tra loro da
link HTML.
I fili di questa ragnatela, intesi come collegamenti ipertestuali, hanno una valenza
puramente sintattica, legata all‟identificazione univoca della risorsa che indicizzano, ma
completamente estranea da una caratterizzazione del significato del collegamento.
La capacità espressiva di questi collegamenti dipende dalla applicazione che li gestisce.
Cercando in un motore di ricerca, ad esempio, un utente inserisce una certa espressione
nella convinzione che quella espressione saprà individuare nel modo più efficace possibile
il contenuto cercato. L'efficacia dell'operazione dipende, però, dagli algoritmi che il
motore di ricerca utilizza per estrarre contenuti. Qualsiasi query attivata, sottoposta ad un
motore di ricerca, è sempre soggetta al rischio della ambiguità. Cercando la parola
"albero", infatti, si potrebbero trovare contenuti legati all'informatica, alla botanica, alla
nautica.
Altro problema, nel web attuale, è quello dell‟interoperabilità delle applicazioni web. Per
interoperabilità delle applicazioni si intende la loro abilità a scambiarsi dati ed
informazioni, a comunicare.
La maggior parte dei siti web non è progettata per fornire servizi ad altri servizi, ma
semplicemente come contenitore di informazioni che possono essere estratte a richiesta. Il
web attuale è quindi definibile “machine-readable”, cioè “leggibile dalle macchine”, e non
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
6
“machine-understandable”,cioè “comprensibile dalle macchine”, e non permette una vera
cooperazione tra programmi e tra programmi ed utenti umani per risolvere problemi
complessi. Per contro, molte applicazioni richiederebbero, da un lato, che i siti web di
varie organizzazioni potessero interagire in modo flessibile e dinamico.
I collegamenti necessari non sono solo quelli sintattici, cioè legati al funzionamento di un
qualche codice di programmazione (questi sono piuttosto solidi, un link localizza infatti
una risorsa attraverso un URL univoco) quanto piuttosto quelli legati alla capacità di
descrivere il significato di un collegamento. Oltre a portare in un determinato luogo un
collegamento dovrebbe descrivere il luogo verso cui porta. La parola giusta per parlare di
questa funzione è capacità semantica.
Quando si parla di web semantico, quindi, si intende proporre un web che possieda delle
strutture di collegamenti più espressive di quelle attuali. Il termine “Semantic Web” è stato
proposto per la prima volta nel 2001 da Tim Berners Lee. Da allora il termine è stato
associato all'idea di un web nel quale agiscano agenti intelligenti: applicazioni in grado di
comprendere il significato dei testi presenti sulla rete e perciò in grado di guidare l'utente
direttamente verso l'informazione ricercata, oppure di sostituirsi a lui nello svolgimento di
alcune operazioni.
Il Web semantico non è separato dal Web “tradizionale”, ma, introducendo il significato
dei dati, ne è un‟estensione, che aggiunge una nuova funzionalità alle macchine, che
diventano in grado di capire ed elaborare i dati che in precedenza semplicemente
visualizzavano.
Un esempio di web semantico: una persona deve fissare un appuntamento dal dottore. Le
agende del paziente e del dottore potrebbero trovare degli elementi comuni che consentano
di concordare una possibile data utilizzando il web semantico, prevedendo anche la
possibilità di spostare appuntamenti meno importanti e di proporre al paziente tale
possibilità, nell‟ovvio rispetto della privacy (tratto dall'esempio più esteso fornito da Tim
Berners Lee, in un famoso articolo pubblicato su Scientific American).
Lo scambio di informazioni presentato avviene poiché tra i due lati della comunicazione,
tra le due applicazioni di gestione degli appuntamenti è realizzata l‟interoperabilità
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
7
semantica. Per interoperabilità semantica tra agenti software nel Web si intende non solo
la capacità di programmi progettati indipendentemente e implementati su piattaforme
diverse di scambiarsi dati, ma soprattutto di cooperare tra loro sulla base di una
“comprensione” del significato dei dati oggetto di scambio.
L‟oggetto di questa tesi è l‟analisi e la realizzazione di un processo a supporto
dell‟interoperabilità semantica nel Web a partire da un sistema per l‟interoperabilità già
esistente, basato sull‟architettura del Triangolo Semantico.
Discuteremo i problemi del modello già esistente, le soluzioni proposte a tali problemi, le
realizzazioni delle modifiche e daremo un cenno all‟architettura risultante.
Nei capitoli iniziali, prima di entrare nel vivo del lavoro di tesi, presenteremo vari modelli
per la comunicazione e l‟interoperabilità semantica, ci focalizzeremo sul modello a
Triangolo Semantico, sul quale si basa il nostro lavoro. Successivamente partendo
dall‟illustrazione del processo di partenza arriveremo alla descrizione del processo
realizzato, che chiameremo “processo ottimizzato”, illustrando dettagliatamente le
modifiche e le motivazioni a supporto.
Dopodiché lasceremo spazio alla sperimentazione, con l‟obiettivo di valutare l‟efficienza e
l‟efficacia del processo ottimizzato rispetto al processo di partenza.
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
8
Capitolo 1
Modelli di interoperabilità semantica
La società in cui viviamo si può sempre di più definire una società dell‟informazione.
Quest‟ ultima viene messa al centro della società, assurgendo al ruolo di risorsa strategica
che condiziona l‟efficienza dei sistemi, ne diviene fattore di sviluppo economico, di
crescita e di ricchezza culturale.
Più cresce l‟importanza che l‟informazione riveste nella nostra società, più cresce
l‟esigenza di avere degli strumenti informatici in grado di garantire il massimo livello di
interconnessioni e interdisponibilità delle risorse informative, per rendere il loro accesso
libero, semplice ed economico.
Da un lato le richieste che vengono effettuate sono di tipo tecnologico, ovvero si vogliono
realizzare delle infrastrutture in grado di dare accesso a chiunque alle fonti informative;
esempio di questa esigenza è il World Wide Web, nato con lo scopo di condividere la
documentazione scientifica dei diversi staff afferenti al CERN di Ginevra. Dall‟altro lato,
le richieste sono quelle di permettere una migliore caratterizzazione delle informazioni in
maniera tale da rendere più efficace la loro individuazione, il loro recupero e il loro uso.
Nel primo paragrafo chiariremo il significato del termine informazione ed esamineremo il
modello classico di comunicazione di Shannon e Weaver e alcune varianti proposte negli
anni che cercano di trattare anche il livello semantico e non solo quello sintattico, allo
scopo di migliorare la qualità e l‟efficacia della comunicazione
Il secondo paragrafo introduce i concetti della semiotica e illustra il modello semiotico-
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
9
informazionale di Umberto Eco.
Il terzo paragrafo parla dell‟information retrieval e extraction e illustra i modelli principali
che vengono utilizzati.
Il quarto paragrafo è relativo ai metodi per la knowledge representation, e viene incentrato
sul formalismo più promettente per la rappresentazione della conoscenza: le ontologie.
Nel sesto paragrafo approfondiamo una serie di modelli proposti per la ricerca semantica.
1.1 Modelli per una teoria dell’informazione
L‟informazione viene considerata come uno dei tre concetti fondamentali delle scienze
naturali, insieme alla materia e all‟energia [1], ma a differenza di questi ultimi due, non
esiste ancora una definizione universalmente accettata di cosa si intenda per informazione.
Lavori pionieristici verso una definizione dell‟informazione furono compiuti da Norbert
Wiener, considerato come il padre della cibernetica. Egli definisce l‟informazione in
questo modo [2]:
“l’informazione è informazione, né materia né energia”
Questo enunciato definisce l‟informazione come una quantità indipendente delle scienze
naturali, suscettibile di misurazione. Così facendo, Wiener apre le porte ad una scienza
quantitativa dell‟informazione.
1.1.1 Modello di comunicazione di Shannon e Weaver
Supponiamo, per esempio, di voler comunicare un‟idea o una sensazione sensoriale ad
un‟altra persona. L‟idea (la morale, l‟arte, un oggetto, un suono, un odore) come tale non
può essere trasmessa direttamente in quanto non è uno stimolo percepibile tra due o più
interlocutori (sostenitori della telepatia a parte). Per trasmettere un‟idea o una sensazione
sensoriale è necessario codificarla in modo che sia adeguata alla capacità recettiva
dell‟interlocutore.
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
10
La teoria matematica della comunicazione prese le mosse dalla risoluzione di un preciso
problema tecnico: studiare le condizioni per migliorare l‟efficienza della trasmissione di
segnali attraverso apparati tecnici di trasmissione. Lo sviluppo di questa teoria fisico-
matematica dovuta a Shannon e Weaver [3] è parallelo alla grande evoluzione delle
telecomunicazioni. In realtà, l‟influenza delle loro ricerche è andata oltre il problema
specifico per cui era nata. Infatti, oltre alla definizione di comunicazione che ancora oggi
utilizziamo, ne è derivata anche l‟elaborazione di uno schema generale dei processi
comunicativi, che ha goduto di una diffusione vastissima negli anni seguenti.
Tale schema ha l‟obiettivo di individuare quegli elementi che devono essere presenti ogni
qual volta si verifichi un trasferimento di informazione. La figura seguente, con qualche
variante, riporta essenzialmente lo schema proposto da Shannon e Weaver.
Figura 1.1
Come è possibile osservare dalla figura 1.1, il messaggio viene codificato in modo da
poter ottenere un segnale da inviare al ricevente attraverso un trasmettitore. Una volta
ricevuto, il segnale sarà decodificato e riconvertito nel messaggio originale. Tra il
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
11
trasmettitore e il ricevitore c‟è il canale, ovverosia il mezzo attraverso il quale transita il
segnale (l‟aria per un messaggio acustico, un cavo per un messaggio telefonico, ecc.).
Lo schema di Shannon e Weaver può essere applicato alla comunicazione linguistica.
Come lo stesso Weaver ha specificato, quando si parla con un‟altra persona il cervello è la
codificazione dell‟informazione, l‟apparato vocale il trasmettitore, le vibrazioni sonore il
canale della comunicazione, l‟orecchio dell‟interlocutore il ricettore ed il suo cervello il
decodificatore del messaggio.
Un esempio di comunicazione linguistica è il seguente. Supponiamo che A voglia
trasmettere a B ciò che vede passeggiando in un parco; per questo scopo, deve effettuare
alcune elaborazioni mentali, trasformando il concetto, l‟idea di albero in un codice
linguistico. Per esempio, un albero di colore verde scuro può essere descritto così: “un
albero con una chioma tondeggiante, sostenuta da rami che si diramano”. Ovviamente un
oggetto di forma meno nota richiederebbe una descrizione più dettagliata. In sostanza, lo
stimolo visivo subisce un processo di concettualizzazione, trasformandosi negli elementi
che caratterizzano gli alberi in generale.
Dopo essere stato codificato il messaggio raggiunge il ricevente, il quale decodifica il
messaggio trasformando il codice linguistico nell‟idea di un albero, che però è abbastanza
differente dall‟originale. Il processo appena descritto è schematizzato nella seguente
figura:
Figura 1.2
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
12
La teoria di Shannon si concentra sugli aspetti meccanici e fisici del messaggio e sui
canali di trasmissione, ad un livello dell‟informazione che potremmo definire sintattico.
Il modello proposto da Shannon è riassunto nella seguente figura:
Figura 1.3 - Il modello di comunicazione di Shannon
Il modello è lineare e considera la comunicazione come passaggio di dati da una sorgente
ad una destinazione attraverso un elemento codificatore, un canale ed un elemento
decodificatore. In una sua versione include anche un‟istanza di feedback o retroazione.
Shannon assume che l‟insieme dei messaggi che una sorgente discreta di informazioni può
produrre consista in un numero finito di simboli
n
a a a A ,..., ,
2 1
, ognuno dei quali ha
una probabilità di occorrenza pari a p
i
. La quantità di informazione trasportata da un
simbolo può essere definita come inversamente proporzionale alla probabilità di
occorrenza:
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
13
i
i
p
a I
1
) (
Intuitivamente, ciò si può spiegare notando che un simbolo la cui probabilità di occorrenza
è pari al 100% ha una quantità di informazione pari a zero. Un simbolo con una bassa
probabilità ha invece una gran quantità di informazione.
Si può dire che, per Shannon, la quantità di informazione di un simbolo è tanto più
grande quante più sono le alternative che esso esclude. La formula di Shannon è:
) ln( * )
1
ln( * ) (
i
i
i
p k
p
k a I
dove l‟uguaglianza deriva dalle proprietà dei logaritmi.
La quantità d‟informazione dell‟intero insieme, indicata con H(A) è pari a:
N
i
N
i
i i i i
p p k a I p A H
1 1
) ln( * * ) ( * ) (
Questa quantità viene detta entropia dell‟insieme A ed a partire da questa è possibile
calcolare la quantità di informazione contenuta in un messaggio.
La teoria di Shannon fu successivamente inquadrata all‟interno del problema generale
della comunicazione da Weaver, il quale individuò i tre aspetti della comunicazione:
problema tecnico: come accuratamente possono essere trasmessi i simboli
problema semantico: come precisamente i simboli trasmessi esprimono il
significato inteso dal mittente
problema di effettività: quali azioni e effetti corrispondono al messaggio presso il
ricevitore
Realizzazione di un processo a supporto
dell’interoperabilità semantica nel Web
14
Su questa impostazione hanno lavorato successivi ricercatori, alcuni considerandola punto
di partenza, altri proponendo un‟impostazione alternativa.
1.1.2 Descriptive Information Theory
Alla metà del secolo scorso, negli anni successivi all‟affermazione della fisica quantistica,
un fisico prestigioso, Donal M. MacKay, [3] propone in una teoria dell‟informazione
chiamata “descriptive information theory”, alla cui base vi è l‟assunzione che
l’informazione è legata ad un aumento di conoscenza. Infatti, secondo l‟autore, diciamo
che abbiamo guadagnato informazione quando conosciamo qualcosa che prima non
conoscevamo, quando ciò che conosciamo è mutato. Secondo MacKay la conoscenza deve
essere intesa come una rappresentazione coerente in cui l‟informazione si inserisce come
un particolare elemento. Questo elemento non può essere capito come una forma isolata,
ma deve avere un minimo di struttura in maniera tale che il ricevente possa capire il
significato inteso dal mittente. Questi elementi strutturali sono detti logons, e la misura ad
essi associata, detta metron, permette di definire la quantità di informazione.
La strada è diversa da quella battuta da Shannon e Weaver, che misuravano la quantità e la
qualità dell‟informazione scambiata in una transazione comunicativa, e per questo
coniarono il bit. Il bit in questa sede è inteso come unità di misura della quantità di
informazione; non esistono sottomultipli del bit: la minima quantità d‟informazione è pari
a un bit ed equivale alla scelta tra due valori (sì/no, vero/falso, acceso/spento), quando
questi hanno la stessa probabilità di essere scelti. Nella prospettiva di MacKay, e di diversi
studiosi nei decenni successivi, la ricerca di una unità minima di informazione era
sostenuta dall‟ipotesi che fosse proprio l‟informazione lo strumento di base per
l‟interpretazione della realtà fisica, in tutti i suoi aspetti.