Linked Open Data per il Cultural Heritage italiano: conversione e pubblicazione nel Semantic Web del Fondo antico del Comune di Novi Ligure

Gratis L'anteprima di questa tesi è scaricabile gratuitamente in formato PDF.
Per scaricare il file PDF è necessario essere iscritto a Tesionline. L'iscrizione non comporta alcun costo: effettua il Login o Registrati.

Mostra/Nascondi contenuto.

Introduzione
Negli ultimi anni abbiamo assistito ad un enorme e rapido aumento non solo della
quantità ma anche della varietà di risorse disponibili online (testi, suoni, immagini,
video, 3D, ecc...). È nata perciò la necessità di descrivere questi dati in maniera
appropriata per permettere agli utenti di trovarli sul web e accedervi ( search and
retrieval ), renderli disponibili a istituzioni e organizzazioni per creare servizi e
permettere anche a fruitori non umani di “consumarli” (es. motori di ricerca,
applicazioni, ecc...)

Specialmente in virtù di questo apporto sempre più decisivo delle tecnologie digitali,
le istituzioni culturali hanno avvertito fortemente la necessità di estendere l’accesso
al proprio patrimonio, aprendo l’orizzonte conoscitivo attraverso il confronto e la
collaborazione con altre realtà.
Gli scenari per lo sviluppo e la trasmissione della conoscenza, nonché per un nuovo
ripensamento del concetto stesso di conoscenza, trovano condizioni ideali in
“ambienti” come il web semantico.

Per queste ragioni, archivi e musei oggi si preoccupano di convertire l’informazione
in dati aperti e soprattutto collegati , superando l’approccio limitante e ormai obsoleto
dei “silos di informazione”. I dati infatti acquistano valore quando sono interconnessi
con altri dati, e questo arricchimento è possibile grazie all’applicazione dei principi e
delle tecnologie Linked Open Data (LOD) .
Far uscire fuori i dati locali e renderli aperti e universalmente accessibili
significa offrire opportunità di visibilità anche a dataset di piccola dimensione o che
fanno riferimento ad una località geografica circoscritta.

Inoltre l’integrazione dei dati con quelli di altre istituzioni non solo aumenta il loro
potenziale informativo ma li rende più completi e riusabili in contesti anche molto
diversi da quelli d’origine.

La mission delle istituzioni culturali oggi è quindi quella di trattare e comunicare le
informazioni sui beni culturali partecipando alla costruzione del web semantico e
alla divulgazione della conoscenza del Cultural Heritage .

8
Tutti i principi che costituiscono il paradigma dei Linked Data , applicati nel mondo
del Cultural Heritage, ne consentono una comunicazione efficace, arricchita e di
ampio raggio, raggiungibile anche dai nuovi fruitori di informazione: le macchine.

In quest’ottica l'obiettivo del progetto consiste nella creazione di un dataset Linked
Open Data relativo alla descrizione di beni artistici e culturali.

Lo scopo finale è quello di pubblicare tali dati all'interno della rete LOD Cloud ,
rendendoli disponibili all'utilizzo da parte anche delle macchine: l’opportunità offerta
da questo nuovo metodo di pubblicare dati sul web, è l’esempio una radicale
trasformazione del rapporto tra utente (umano e non) e universo dei beni culturali.

Il progetto vuole perciò presentarsi come esempio, in scala, della rivoluzione
copernicana dei Linked Open Data nel mondo dei beni culturali.

● Il Capitolo 1 passa in rassegna il vasto mondo dei Linked Open Data e del
web semantico, illustrandone i principi, l’evoluzione nel tempo e
approfondendo i concetti di RDF, ontologie, vocabolari.

● Il Capitolo 2 scende nel dettaglio del mondo dei beni culturali, e in particolar
modo dell’approccio Linked Open Data applicato all'interno di questo mondo,
evidenziando i vantaggi che vi può apportare. Viene fatta una panoramica
generale degli standard di metadati internazionali e nazionali, con particolare
attenzione ad alcuni standard d’interesse utilizzati in Italia per i beni culturali.

● Il Capitolo 3 descrive lo stato dell’arte degli Open Data e dei Linked Data in
Italia per trarne qualche informazione quantitativa in modo da valutare
l’adozione di tali approcci. Inoltre passa in rassegna alcuni lavori simili al
progetto svolto.

● Il Capitolo 4 presenta una panoramica generale del Linked Open Data
Project e della sua evoluzione nel tempo. Illustra inoltre alcuni modelli e
approcci alla pubblicazione di dati LOD presenti in letteratura, e si sofferma
sulla descrizione del portale Mèmora, la fonte dei dati del progetto.

9
● Il Capitolo 5 descrive nel dettaglio tutte le fasi del lavoro di conversione e
pubblicazione dei dati del Fondo antico di Novi Ligure in Linked Open Data .

● Il Capitolo 6, infine, presenta una breve valutazione del lavoro svolto ed
espone i possibili sviluppi futuri e le considerazioni conclusive.

10
1. Linked Open Data
1.1 Rappresentazione della conoscenza
Per descrivere i dati, si usano i metadati , cioè informazioni (marcatori) che li
descrivono.
Ne esistono diversi tipi, a seconda della tipologia di risorsa da descrivere
(amministrativi e gestionali, descrittivi, di conservazione, tecnici).

Gli standard di metadati nazionali e internazionali più usati nel mondo delle
biblioteche e dei beni culturali sono i seguenti: MARC, DC, MODS, METS, MIX,
EAD, ISBD, RDA, VRA, ISAAR, ISAD, ISNI, NIERA.
Ciascuno di essi è descritto nel dettaglio al capitolo 2 .

1.2 RDF ( Resource Description Framework )
1
RDF è un modello proposto dal World Wide Web Consortium (W3C) per la codifica,
2
lo scambio e il riutilizzo di dati strutturati e consente l' interoperabilità semantica tra
applicazioni che condividono le informazioni sul Web.
La crescente interoperabilità fra i dati è certo un avanzamento molto
rilevante, dal punto di vista tecnico [...] Tuttavia, come sempre, la tecnica
non basta. Perché sia giustificato l’aggettivo “semantico”, occorre che i dati
siano interoperabili non solo in quanto stringhe di bit ma anche in quanto
significati. Occorre cioè riconoscere e trattare problemi di omografia e
sinonimia fra termini e di relazioni fra concetti
3

1
Standard RDF, ultima versione
https://www.w3.org/TR/2014/NOTE-rdf11-primer-20140624/
2
W3C https://www.w3.org/
3
C. Gnoli, Connettere la conoscenza: quattro livelli di interoperabilità, in Biblioteche oggi,
vol.32, n°5, 2014, pp. 9-10

11
Il modello di dati RDF è progettato per la rappresentazione integrata di informazioni
4
che provengono da più fonti e rappresenta le informazioni come grafi diretti
etichettati (vedi fig. sotto).
La descrizione di una risorsa è rappresentata da un numero di triple ; le tre parti di
5
ogni tripla sono soggetto , oggetto (nodi del grafo) e predicato (arco del grafo),
identificati rispettivamente da tre URI .
Gli URI del soggetto e dell’oggetto identificano le risorse correlate, mentre quello del
predicato definisce il tipo di relazione tra le risorse.
In particolare, gli URI predicati sono raccolti in vocabolari utilizzati per rappresentare
informazioni su un determinato dominio.

Fig. 1.1 Esempio di una tripla RDF rappresentata con un grafo.

RDF fornisce un modo per descrivere entità del mondo (persone, luoghi o concetti
astratti) e il modo in cui esse si relazionano (si “collegano”) ad altre entità, così da
offrire ai calcolatori una conoscenza del nostro universo.
RDF permette di rappresentare ma anche di pubblicare queste informazioni sul Web
in una forma che gli altri (umani o macchine) possono scoprire e riutilizzare.
6
4
Modello di dati RDF: https://www.w3.org/TR/rdf-concepts/
5
Non ci occupiamo qui di triple letterali ma di collegamenti RDF : per approfondire
http://linkeddatabook.com/editions/1.0/#htoc16
6
Per approfondire: T. Baker, La traduzione dei dati nel linguaggio del web semantico , in
Rivista italiana di biblioteconomia, archivistica e scienza dell’informazione, vol.4, n°1, 2013,
https://www.jlis.it/article/view/6308/7866

12
I collegamenti RDF possono essere interni ed esterni:
● I link RDF interni collegano le risorse all'interno di una singola fonte
( repository ) di dati collegati. Pertanto, gli URI di soggetto e oggetto hanno lo
stesso namespace .
● I link RDF esterni connettono risorse provenienti da diverse origini di dati
collegati. Gli URI di soggetto e oggetto hanno namespace diversi. I link
esterni sono fondamentali per lo sviluppo e il mantenimento del web of data
( cap. 1.4 ).

Le caratteristiche principali dei link RDF che vale la pena notare in questo contesto
sono quelle che li differenziano dai link HTML ( <a>...</a> ) :
7
● I link RDF collegano entità, non solo documenti.
● I link RDF sono tipizzati. Ciò significa che non lasciano all'utente l'inferenza
della natura della loro relazione, ma consentono all'editore di dichiarare
esplicitamente in tipo di connessione. Ad esempio, il collegamento “amico di”
è un tipo di relazione tra due persone. Rendendo espliciti questi
collegamenti, RDF permette alle applicazioni di percorrerlli e scoprire una
quantità sempre maggiore di dati .
Rendere espliciti i link tra diversi dataset, specialmente a livello semantico, richiede
la definizione rigorosa di tutte le caratteristiche “astratte” del sistema di dati e
metadati. Questo processo richiede l'individuazione di vocabolari e ontologie di
riferimento.
7
C. Bizer, T. Heath, Linked Data: Evolving the Web into a Global Data Space (1st edition) ,
2011, cap. 2.1.
A. Iacono, Introduzione a Linked Open data e Web semantico , 2016, Università La
Sapienza, Roma, pp.36-37

13
Fig. 1.2 Esempi di ink RDF interni ed esterni

1.3 Ontologie e vocabolari
La distinzione tra ontologie e vocabolari , nell’ambito della rappresentazione formale
della conoscenza, non è netta. Generalmente:
● Un vocabolario è una lista chiusa di termini da usare come valori nella tripla
RDF.
● Una ontologia è una rappresentazione formale per concettualizzare un
dominio di interesse, cioè per descrivere relazioni / modelli concettuali
tramite classi e proprietà . Serve per descrivere il modo in cui diversi schemi
vengono combinati in una struttura dati (vocabolario) contenente tutte le entità
rilevanti e le loro relazioni all’interno del dominio.
8

8
Mentre i meccanismi di classificazione si occupano dell’accesso all’informazione,
basandosi su criteri prederminati codificati con elementi “sintattici”, le ontologie si
concentrano sul significato (“semantica ” ) dei termini e sulla natura e struttura di un dominio.
(O. Signore, O. Missikoff, P. Moscati, La gestione della conoscenza in archeologia: modelli,
linguaggi e strumenti di modellazione concettuale dall’XML al Semantic Web , in Archeologia
e Calcolatori, n°16, 2005, pag. 294)

14
I vocabolari controllati sono insiemi di termini prescelti in quanto d’uso attestato da
9
una o più fonti ( authorities ), raccolti e ordinati logicamente tra loro allo scopo di
riferire le varianti (ortografiche, sincroniche, diacroniche, …). Nel caso in cui i termini
siano connessi tra loro anche in relazione gerarchica o associativa, i vocabolari
controllati prendono il nome di thesauri .
1011

[...] thesauri, mappe concettuali e ontologie non possono essere usati se non
in stretta correlazione l’uno con gli altri. Attraverso uno stretto legame tra le
diverse autorità terminologiche si può realizzare un effettivo controllo della
conoscenza senza il quale Internet rischia di diventare un’immensa raccolta
di dati e di informazioni difficilmente utilizzabili.
12

Le varie istituzioni hanno preferenze diverse sui vocabolari da utilizzare per
rappresentare i propri contenuti: standard differenti vengono quindi utilizzati
parallelamente.
Nonostante questa generale apertura, è considerata una buona pratica riutilizzare,
ove possibile, termini da vocabolari RDF noti al fine di rendere più semplice
l'elaborazione delle applicazioni client . Solo se questi vocabolari non forniscono i
termini richiesti, gli editori di dati possono definire una nuova terminologia specifica
per i dati.

Tra quelli più utilizzati ci sono:

● SKOS ( Simple Knowledge Organization System ), per esprimere thesauri e
13
gerarchie concettuali (tassonomie);
9
Vocabolari controllati dell’ICCD:
https://github.com/ICCD-MiBACT/Standard-catalografici/tree/master/strumenti-terminologici
10
L. Corti, Beni culturali, standards di rappresentazione, descrizione e vocabolario , in:
Informatica e beni culturali , Franco Cosimo Panini Editore, Modena, 1992, pag. 193.
“Thesaurus: costruzione ramificata di un vocabolario, specifica per disciplina” (Sapienza
Università di Roma, Banca dati LOD della Biblioteca di Economia “Enrico Barone”, Il web
semantico oggi, pag.2)
11
Nei sistemi di Information Retrieval, la valutazione dei valori di “precisione” e “recupero”
avviene (anche) in rapporto al vocabolario controllato (vedi:
https://en.wikipedia.org/wiki/Precision_and_recall ).
12
P. Capitani, Il Knowledge Management, in: Associazione Italiana Formatori , Franco Angeli
Editore, Milano, 2006 , pag.47
13
https://www.w3.org/TR/skos-reference/ , https://www.w3.org/2004/02/skos/

15
● DCMI ( The Dublin Core Metadata Initiative ) Metadata Terms : definisce
14
attributi generici come “titolo”, “autore”, “data”, ecc ...
● FOAF ( Friend-of-a-Friend ): definisce termini per descrivere persone, le loro
15
attività e le loro relazioni con altre persone e oggetti.

OWL ( Web Ontology Language ) e RDF Schema (RDFS) sono invece delle
16 17
ontologie.
RDFS è un insieme di classi e proprietà RDF che estende il vocabolario base di RDF e
viene utilizzato per strutturare altri vocabolari RDF; diverse delle sue componenti sono
incluse in OWL che è più espressivo.

Fig. 1.3 Ontology Spectrum : diagramma dei vari tipi di ontologia in base alla forza
semantica.
18
Le tecnologie messe a disposizione dal Semantic Web si collocano tra i punti più alti di
questo diagramma, permettendo di esprimere in modo completo il significato ontologico dei
dati spiegando come questi devono essere interpretati.

14
http://www.dublincore.org/specifications/dublin-core/dcmi-terms/
15
http://xmlns.com/foaf/spec/
16
https://www.w3.org/TR/owl-features/
17
https://www.w3.org/TR/rdf-schema/
18
M. C. Daconta, L. J. Obrst, K. T Smith, The Semantic Web: A Guide to the Future of XML,
Web Services, and Knowledge Management , Wiley, 2003.

Anteprima dalla tesi:

Linked Open Data per il Cultural Heritage italiano: conversione e pubblicazione nel Semantic Web del Fondo antico del Comune di Novi Ligure

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

Informazioni tesi

Autore:	Diletta Goglia
Tipo:	Laurea I ciclo (triennale)
Anno:	2017-18
Università:	Università degli Studi di Pisa
Facoltà:	Informatica Umanistica
Corso:	Lettere
Lingua:	Italiano
Num. pagine:	183

FAQ

Come consultare una tesi

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni

Perché consultare una tesi?

Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:

perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.

Clausole di consultazione

L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.

Vuoi tradurre questa tesi?

L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

patrimonio culturale

cultural heritage

archivio digitale

linked open data

open data

linked data

digital humanities

novi ligure

beni culturali

Tesi correlate

Non hai trovato quello che cercavi?

Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

individua con precisione le parole chiave specifiche della tua ricerca
elimina i termini non significativi (aggettivi, articoli, avverbi...)
se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
utilizza la ricerca avanzata
utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti

Come si scrive una tesi di laurea?

A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.

Leggi la guida

La tesi l'ho già scritta,
ora cosa ne faccio?

La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi

Scopri di più

Linked Open Data per il Cultural Heritage italiano: conversione e pubblicazione nel Semantic Web del Fondo antico del Comune di Novi Ligure

Anteprima dalla tesi:

Linked Open Data per il Cultural Heritage italiano: conversione e pubblicazione nel Semantic Web del Fondo antico del Comune di Novi Ligure

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Informazioni tesi

FAQ

Come consultare una tesi

Perché consultare una tesi?

Clausole di consultazione

Vuoi tradurre questa tesi?

DUBBI? Contattaci

Parole chiave

Tesi correlate

Non hai trovato quello che cercavi?

Ottimizza la tua ricerca:

Idee per la tesi?

Come si scrive una tesi di laurea?

La tesi l'ho già scritta,ora cosa ne faccio?

Login

La tesi l'ho già scritta,
ora cosa ne faccio?