6
oggi si basa solo sul lavoro di un centinaio di volontari. Il primo testo
digitale è stato la Dichiarazione d’Indipendenza degli Stati Uniti; oggi
l’archivio contiene circa 3500 documenti digitali, prevalentemente in
lingua inglese, ma non mancano alcuni testi in francese, spagnolo ed
italiano.
I primi progetti italiani ad apparire in rete sono il Dartmouth Dante project,
che mette a disposizione, gratuitamente, il testo completo della Divina
Commedia insieme a circa 70 commenti e Manuzio che ha come obiettivo
la diffusione gratuita di testi letterari italiani, in particolare dei classici.
Nel 2001 nell’Università di Napoli “Federico II” ha preso il via la
realizzazione di un corpus digitale della documentazione prodotta dalla
cancelleria angioina nei secoli XIII-XV, al fine di consentire la
consultazione elettronica dei registri, ricostruiti dopo la distruzione del
1943.
Gli atti prodotti in quegli anni nel regno angioino rappresentano, secondo
una considerazione di Benedetto Croce, una fonte preziosa per la storia,
non solo del Regno di Napoli, ma di tutta l’Europa, anzi con questa
dell’intero bacino del Mediterraneo.
Purtroppo questa documentazione a seguito di numerosi avvenimenti
succedutisi nel corso dei secoli è andata totalmente distrutta.
Molti atti andarono perduti per opera degli stessi Maestri Razionali che,
dopo i rendiconti e l’emissione delle relative quietanze, distruggevano le
7
loro rationes. Altre perdite notevoli si ebbero per infiltrazioni di acqua
piovana nelle stanze dell’Archivio. Molti registri andarono in rovina
durante la peste del 1527. Ancor più grave è l’episodio del 1701, quando la
plebe, sobillata dai nobili, assaltò il castello di Capuana, dandovi fuoco.
Nell’incendio andarono distrutti 60 registri della Sommaria.
Infine, nonostante gli sforzi compiuti dal direttore dell’Archivio di Stato di
Napoli, Riccardo Filangieri di Candida, per organizzarne la conservazione,
durante la seconda guerra mondiale, fu distrutto ciò che ancora restava
dell’antico archivio della Regia Zecca.
Lo sforzo di preservare i documenti, infatti, fu reso vano dal gesto
criminale di alcuni soldati tedeschi, che il 30 settembre 1943, a soli due
giorni dall’arrivo degli alleati, diedero fuoco alla villa Montesano,
minacciando di morte chiunque avesse tentato di spegnere il fuoco o
salvare le carte. Solo l’intervento di alcuni uomini coraggiosi, penetrati in
una delle sale non ancora invasa dal fuoco, consentì di salvare 11 casse, 97
buste dell’Archivio Farnesiano e qualche volume dei processi della
Sommaria.
L’enorme perdita, comunque, non scoraggiò il Filangieri, che, in
collaborazione con gli archivisti napoletani, diede il via all’ardua e lunga
opera di ricostruzione dell’antica cancelleria secondo la struttura originaria.
Egli rivolse un appello a chiunque avesse lavorato sull’archivio per avere a
Napoli il frutto di quegli studi.
8
La Sezione Diplomatica dell’Archivio, diretta da Jole Mazzoleni, nel 1944
fu trasformata nell’Ufficio della ricostruzione angioina, con compiti di
ricerca e trascrizione di documenti tratti dall’archivio della cancelleria.
A seguito di un lavoro lungo e ricco di difficoltà, i documenti furono
ricostruiti, non come apparivano in archivio al momento della distruzione,
ma come erano stati prodotti dalla cancelleria medievale; si arrivò, nel
1950, alla pubblicazione del primo volume dei Registri della Cancelleria
angioina, da parte dell’Accademia Pontaniana. Alla scomparsa del
Filangieri, l’opera di ricostruzione è stata proseguita prima da Jole
Mazzoleni, e poi da Stefano Palmieri.
Il lavoro del dipartimento di discipline storiche “Ettore Lepore” prosegue
idealmente quello di Filangieri e degli archivisti napoletani.
Per cominciare è stata effettuata la scansione dei volumi pubblicati
dall’Accademia Pontaniana, in modo da acquisire il testo in formato
digitale utilizzando un programma di riconoscimento ottico dei caratteri
(OCR). I files di testo ottenuti sono stati controllati ortograficamente per la
correzione degli inevitabili errori di “lettura” del testo a stampa.
I documenti così acquisiti, sono stati poi indicizzati e lemmatizzati
utilizzando un software che consente l’analisi strutturale dei file di testo,
creando una lista delle parole che si ripetono in maniera significativa nel
documento. Il risultato è una sorta di indice analitico dove per ciascun
lemma viene riportata la stringa in cui occorre e i riferimenti al numero
9
della pagina e del rigo in cui ricorre nel testo a stampa. Per una corretta
elaborazione è stata creata una ‘stop list’ che esclude tutti i lemmi
semanticamente poco pregnanti, come le congiunzioni, le preposizioni, i
verbi più comuni. In questo modo, il risultato percentuale dei termini
indicizzati è in media la metà del totale contenuto nel documento.
A questo punto, perché ci sia omogeneità tra le indicizzazioni dei vari
registri e sia possibile la consultazione via internet dei documenti mediante
un motore di ricerca, tutti i dati sono stati raccolti ed elaborati nella
struttura del Polo Informatico. Questa fase della ricerca rappresenta il
momento centrale dell’intero lavoro: rendere possibile qualsiasi
interrogazione dell’archivio elettronico realizzato, considerando
contemporaneamente tutti i lemmi ricavati dai documenti.
La moderna tecnologia offre, in questo modo, la possibilità di avere a
disposizione una serie di documenti collegati tra loro, anche se fisicamente
lontani, e “riapre”, agli studiosi di tutto il mondo, lo straordinario archivio
degli angioini di Napoli.
10
CAPITOLO I
LE NUOVE FRONTIERE DELLA BIBLIOTECA
11
LA BIBLIOTECA MODERNA
La biblioteca rappresenta il luogo deputato alla conservazione e alla
diffusione di documenti testuali che contribuiscono alla trasmissione della
cultura; un’istituzione antichissima, sorta al tempo degli egizi,
1
che ha
saputo stare al passo con i tempi, seppur tra notevoli difficoltà, con
l’utilizzo delle più moderne tecnologie.
Oggi, infatti, sempre più spesso si sente parlare di biblioteca automatizzata,
elettronica, virtuale, digitale.
2
Ogni vocabolo è legato alla messa in atto di
differenziate procedure informatiche.
Fondamentalmente il ricorso a sistemi automatici di gestione ha il fine di
agevolare l’utente nell’accesso alla documentazione, e fornire un supporto
nel recupero dei dati. Questo ha significato sostituire al supporto cartaceo,
il supporto elettronico per l’immagazzinamento dei dati bibliografici
(biblioteca elettronica o informatizzata), fino ad arrivare alla distribuzione
dei dati in formato full-text, all’interno di un sistema integrato che prevede
la descrizione, consultazione e distribuzione dei dati (biblioteca digitale).
3
Grazie dunque alle nuove tecnologie, la biblioteca può assolvere al suo
compito ben oltre il luogo fisico deputato alla conservazione dei libri.
1
Giovanni Solimine, L’informazione in biblioteca, Milano, Editrice Bibliografica, 1985, p.15.
2
Teresa Numerico – Arturo Vespignani, Informatica per le scienze umanistiche, Bologna, Il Mulino,
2003, p.165.
3
Ivi, p.166.
12
LO SVILUPPO DELL’INFORMATICA E L’AVVENTO DI
INTERNET
Siamo ormai entrati a pieno titolo nell’era digitale, in cui la tecnologia
permea ogni aspetto della vita moderna, trasformandolo profondamente.
Questa nuova era è frutto di una lenta ma inesorabile evoluzione, che
affonda le proprie radici negli anni 50, quando furono costruiti i primi
calcolatori elettronici, e che ha conosciuto, nell’ultimo decennio, una
improvvisa e inarrestabile accelerazione, portando in breve tempo alla
penetrazione dell’informatica e delle nuove tecnologie in tutti i settori della
vita quotidiana. In particolare, negli ultimi dieci anni, la diffusione di
Internet ha segnato una svolta epocale, fornendo a chiunque disponga di un
computer la possibilità di comunicare, ma anche di fornire o usufruire di un
servizio in ogni angolo del mondo.
Internet è l’insieme mondiale di reti
4
e gateway
5
che impiegano i protocolli
TCP/IP
6
per comunicare tra loro. Il cuore di Internet è la dorsale di linee di
trasferimento dati ad alta velocità tra nodi maggiori o tra host
7
; tale insieme
4
Gruppo di calcolatori e dispositivi associati collegati da canali e apparecchiature di
comunicazione.Possono presentare collegamenti permanenti o temporanei attivati attraverso il telefono o
altri legami di comunicazione.
5
Dispositivo impiegato per collegare reti che usano protocolli di comunicazione diversi, in modo che le
informazioni possano passare da una rete all’altra.
6
Acronimo di Transmission Control Protocol/Interface Program. Una serie di protocolli sviluppati dal
Dipartimento della Difesa statunitense, per le comunicazioni tra reti interconnesse, a volte diverse tra
loro.
7
Nodo centrale al quale tutti i nodi periferici fanno riferimento, fornendo una struttura centralizzata e
gerarchica.
13
è costituito da migliaia di sistemi di computer commerciali, governativi,
educativi, che instradano dati e messaggi.
8
Uno o più nodi di Internet possono essere in modalità offline senza mettere
in pericolo internet nella sua complessità o interrompere comunicazioni,
perché nessun calcolatore singolo o rete singola controllano Internet.
Internet è derivata da una rete decentralizzata, ARPANET, creata dal
Dipartimento della Difesa Americano nel 1969 per facilitare le
comunicazioni nell’eventualità di attacchi nucleari.
9
In seguito, altre reti,
comprese BITNET, Usenet, UUCP e NSFnet, sono state collegate ad
ARPANET. Attualmente, Internet offre un’ampia gamma di servizi agli
utenti, per esempio FTP, email, World Wide Web, news di Usenet, Gopher,
IRC, Telnet e altri.
10
Dunque Internet non è solo Web, anche se il World Wide Web costituisce
oggi l’interfaccia più utilizzata per rendere accessibile in Rete ogni tipo di
risorse.
11
Gli Url (Uniform resource locator) costituiscono gli oggetti più
importanti della Rete. Non sono solo gli indirizzi dei siti Web, ma dei
puntatori universali in grado di indicare in modo univoco qualsiasi risorsa
Internet, dagli indirizzi di posta elettronica agli archivi accessibili via
Telnet. In ciascun Url, la prima parte specifica il protocollo usato per lo
scambio di dati, la seconda parte l’indirizzo della risorsa, e la terza parte,
8
Dizionario di Internet e delle reti, Milano, Mondadori Informatica, 2003, p.356.
9
Configurazione software e reti, Autorità Informatica Pubblica Amministrazione – RTI, 2001, p.12.
10
Dizionario di Internet e delle reti, Milano, Mondadori Informatica, 2003, p.356.
11
Fabio Metitieri – Riccardo Ridi, Biblioteche in rete - istruzioni per l’uso, Bari, Laterza, 2003, p. 26.
14
un numero non sempre presente, la porta logica utilizzata per quel servizio
dal calcolatore che lo fornisce.
12
Nel caso di un WWW, nell’Url http://www.melvyl.ucop.edu:80 http indica
che il collegamento avviene secondo il protocollo del Web, http appunto,
mentre www.melvyl.ucop.edu è l’indirizzo del calcolatore che ospita il
catalogo, e 80 è il numero della porta logica utilizzata. Nel caso di un
catalogo accessibile via Telnet, l’Url può essere
telnet://melvyl.ucop.edu:23, dove telnet indica il protocollo usato per il
collegamento, Telnet appunto. Analogamente un Url mailto: è un indirizzo
di posta elettronica e un Url gopher:// indica un vecchio server Gopher.
Prima della diffusione del WWW, gli strumenti disponibili in rete erano la
posta elettronica, il File transfer protocol (Ftp) per il trasferimento di file e
il comando Telnet per l’emulazione di terminale.
13
Quest’ultimo,
considerato dai nuovi utenti scomodo e difficile da usare, è storicamente il
primo tipo di accesso agli Opac, ma ormai è diventato del tutto inutile,
sostituito dalle interfacce Web, ha raggiunto i Gopher e i Wais nell’elenco
degli strumenti che ormai si devono conoscere soltanto per memoria
storica.
12
Fabio Metitieri – Riccardo Ridi, Biblioteche in rete - istruzioni per l’uso, Bari, Laterza, 2003, p. 27.
13
Ibidem.
15
LA DESCRIZIONE BIBLIOGRAFICA INFORMATIZZATA
L’adozione di procedure informatiche per il trattamento dei dati
bibliografici ha prodotto un notevole aumento di interscambi a livello
internazionale, e soprattutto, ha reso necessaria la ricerca di standard
descrittivi, come l’ISBD (International Standard Bibliographic
Description), con la funzione di fornire e definire un formato di scambio
delle registrazioni catalografiche.
14
Da questa esigenza di standardizzazione
deriva il formato MARC (Machine Readable Cataloguing), creato negli
anni settanta del secolo scorso dalla Library of Congress, al fine di
migliorare lo scambio dei dati tra agenzie nazionali e tra reti bibliotecarie.
15
Molte biblioteche lo adottarono, adattandolo però alle proprie specifiche
esigenze catalografiche, portando alla nascita di molteplici formati MARC.
Nacque così, nel 1977, UNIMARC (Universal MARC format) sviluppato
dall’IFLA (International Federation of Library Associations and
Institutions) e strettamente legato all’ISBD.
La versione italiana di MARC, ANNAMARC
16
(Automazione nella
nazionale) venne usata dal 1975, con l’avvio della registrazione su nastro
magnetico dei dati della Bibliografia Nazionale Italiana (BNI), ma a partire
dal 1985 la BNI è prodotta in UNIMARC e anche i dati del Servizio
14
Teresa Numerico – Arturo Vespignani, Informatica per le scienze umanistiche, Bologna, Il Mulino,
2003, p.166.
15
Emma Coen Pirani, Nuovo manuale del bibliotecario, Modena, Mucchi editore, 1999, p. 369.
16
Ivi, p. 370.
16
Bibliotecario Nazionale (SBN) sono esportabili e importabili in questo
formato. Anche gran parte dei sistemi OPAC adottano questo sistema.
17
Nel 1998, infine, è stato presentato dall’IFLA un nuovo modello
concettuale per l’organizzazione dei record informativi, denominato FRBR
(Functional Requirements for Bibliographic Records). FRBR da una parte
approfondisce e rende più rigorosi i concetti classici della catalogazione,
mentre dall’altra richiede sia ai produttori che ai fruitori di bibliografie e
cataloghi una riorganizzazione concettuale, tale da mettere in discussione la
catalogazione attuale basata sull’ ISBD e sull’UNIMARC.
18
17
Teresa Numerico – Arturo Vespignani, Informatica per le scienze umanistiche, Bologna, Il Mulino,
2003, p.169.
18
Ivi, p.170.
17
CATALOGHI ELETTRONICI E OPAC
L’ambito in cui le pratiche elettroniche applicate al mondo delle
biblioteche hanno raggiunto i risultati più interessanti è quello legato alla
realizzazione del catalogo elettronico.
Moltissime biblioteche stanno progressivamente trasferendo i loro
cataloghi in banche dati digitali, mettendoli a disposizione via internet. Tali
cataloghi sono chiamati anche OPAC, dalla sigla di Online Public Access
Catalog, ossia catalogo in linea accessibile pubblicamente.
19
Gli OPAC, sviluppati e messi in rete sin dall’inizio degli anni 80, possono
essere consultati da qualsiasi calcolatore connesso in rete, in tutto il mondo
e consentono di cercare gli stessi documenti in diverse biblioteche, e di
recuperare l’informazione in breve tempo.
20
La grande novità introdotta dal catalogo elettronico è, inoltre, la possibilità
di superare alcune limitazioni del catalogo cartaceo:
ξ Il problema della scelta dell’intestazione della scheda catalografica
cartacea. Il record catalografico è, infatti, interrogabile a partire da
diversi campi costituenti la scheda (autore, titolo, soggetto, ma
spesso anche luogo di pubblicazione, editore, classificazione, codice
ISBN.)
19
Giovanni Solimine, L’informazione in biblioteca, Milano , Editrice Bibliografica, 1985, p.16.
20
Fabio Metitieri – Riccardo Ridi, Biblioteche in rete - istruzioni per l’uso, Bari, Laterza, 2003, p. 45.
18
ξ Il problema della forma da assegnare all’intestazione, o alle chiavi di
accesso all’informazione, superato individuando le forme accettate e
collegando a queste le forme varianti tramite l’impiego di rimandi
invisibili all’utente finale.
ξ La divisione del catalogo per autori dal catalogo per soggetti.
ξ L’estensione delle chiavi d’accesso all’informazione, con l’aggiunta
di key words (parole chiave), desunte dal titolo, dall’introduzione,
dal sommario o da altre zone significative del documento, in uno
specifico campo della registrazione catalografica. La ricerca
dell’informazione ha così la certezza del recupero.