2
giurisprudenza amministrativa dal 1984 in poi; le Leggi d’Italia , testo vigente,
commentato dalla giurisprudenza, edito dalla De Agostini; Juris data edito
dalla Giuffrè che raccoglie su Cd ROM tutti i dati riportati nella rivista
Giustizia civile repertorio, nonché tutte le banche dati della Casa Editrice La
Tribuna, come ad esempio TuttoPenale, TuttoCivile, Il Repertorio di
Giurisprudenza (che contiene, in pratica, tutte le sentenze presenti nella banca
dati centrale della casa editrice), TuttoAmbiente, TuttoCircolazione ed anche le
raccolte (ultimi undici anni) delle prestigiose riviste. Ritornando ai vantaggi
offerti dal Cd ROM, la multimedialità rappresenta un superamento del
veicolo cartaceo; si tratta, si può dire, di un libro fatto di pagine dove testo,
grafica, audio e video concorrono a fornire una informazione estremamente
ricca e articolata, garantendo percorsi di lettura interattivi. Invero in passato i
dati, la voce e le immagini sono stati trattati in modo separato e differente
utilizzando per ciascuno un diverso canale (rispettivamente la scrittura, il
telefono e la televisione) e una diversa tecnologia; oggi, invece, con la
digitalizzazione tutti i differenti canali vengono riuniti in uno solo che usa
un’unica tecnologia (si parla allora di ipermedia e ipertesto). La logica che
governa un progetto multimediale è quindi quella di usare tutte le materie
prime a disposizione (testo, video, audio, immagini, animazioni) con la
possibilità di mostrare le informazioni da vari punti di vista con strutture
flessibili. Il nuovo supporto informatico integrerà e non sostituirà quello
cartaceo, ciò almeno fino alla scoperta completa di quella tecnologia che
renderà un gesto automatico e normale l'accesso al computer e alle banche
dati, cioè Internet.
La professione dell’autore della presente tesi consiste nel realizzare banche
dati su Cd ROM riguardanti praticamente tutte le materie giuridiche: svolge
questa attività come Responsabile dell’Area Multimedia della Casa Editrice La
Tribuna. Il Cd ROM è lo strumento ideale al fine della veicolazione delle
banche dati di diritto e potrà essere superato e reso obsoleto soltanto
quando Internet diventerà completamente operativo in tal senso. Con questa
tesi di laurea l’autore ha la possibilità di illustrare la propria esperienza nel
campo della multimedialità applicata al diritto vigente e spiegare come
procede alla realizzazione di una banca dati su Cd ROM servendosi degli
strumenti forniti dalla Casa Editrice La Tribuna (CELT).
La tesi di laurea è strutturata in quattro parti ognuna delle quali rappresenta
una fase del procedimento di creazione della banca dati; nella prima parte
vengono trattate le problematiche che stanno alla base di un progetto: la
ricerca dei dati relativi al progetto che si intende realizzare con
l’individuazione delle fonti (ad esempio Internet e Banca dati centrale della
Casa Editrice La Tribuna) da cui questi dati vengono attinti, l’individuazione
del software per la realizzazione della banca dati, nonchè l’illustrazione dei
criteri di ricerca che si possono utilizzare per cercare un documento
all’interno della banca dati stessa, con particolare riferimento alla ricerca full-
text. Nella seconda parte viene illustrato il software di conversione dei dati
3
acquisiti e, passo per passo, con l’ausilio delle immagini delle schermate,
tutta la procedura che conduce alla creazione della banca dati. La terza parte
è dedicata al View & Edit, cioè alla verifica e alla correzione dei dati
all’interno della banca dati mediante l’utilizzo avanzato di un comune
programma di videoscrittura e di alcune specifiche macro. Quando la banca
dati è stata verificata e corretta si passa alla digitalizzazione dei dati su Cd
ROM, creando il prodotto finale (Cd ROM duale) che può essere consultato
sia in ambiente Windows sia in ambiente Macintosh; quest’ultima fase è
dettagliatamente illustrata nella quarta ed ultima parte.
Alla presente tesi è allegato un Cd ROM realizzato secondo i criteri e la
tecnica di seguito illustrati e che contiene una banca dati costituita da tre
archivi (dottrina, giurisprudenza e legislazione) relativi alla tutela giuridica del
software.
4
1. PARTE PRIMA: LA PRODUZIONE DI UNA BANCA
DATI SU CD-ROM
Introduzione
In questa prima parte vengono trattate le problematiche che stanno alla base della creazione
di una banca dati su cd-rom e che consistono nello studio del progetto che si intende
realizzare, nella conseguente ricerca del materiale nonché nell’individuazione dei criteri di
ricerca ai fini della consultazione della banca dati stessa.
1.1 L’individuazione dei dati e del software per la
realizzazione del progetto
La creazione di una banca dati su cd-rom non implica solo delle conoscenze
tecnico-informatiche ai fini della digitalizzazione di una serie di documenti;
l’aspetto senz’altro più importante consiste nella stesura di un progetto il
quale, oltre a valutare la fattibilità tecnica della banca dati, deve prendere in
considerazione la struttura della stessa, il suo contenuto ai fini della
consultazione e la sua possibile utilità.
Per la realizzazione della banca dati in esame (Prototipo di banca dati su cd-rom in
materia di tutela giuridica del software) è stata compiuta, innanzitutto, una
valutazione ai fini dell’individuazione della programma con cui creare
tecnicamente la banca dati in relazione ai documenti da trattare e,
successivamente, da indicizzare. La scelta è caduta su CD Author della
Dataware in quanto prodotto particolarmente adattabile alla materia giuridica;
infatti, tale prodotto è utilizzato dalla Casa Editrice La Tribuna per la
realizzazione di tutte le banche dati su cd-rom in quanto permette di trattare
ogni tipo di documento contenuto nella banca dati centrale de La Tribuna.
La banca dati centrale contiene documenti in formato Ventura che è un
formato abbastanza vetusto ma comunque valido ai fini della stampa di un
certo tipo di libri (es. i codici vigenti); Ventura è un linguaggio che, in pratica,
identifica, mediante tag (marcatori) le varie parti di un documento: ad
esempio, una legge contiene i seguenti tag che provvedono a suddividerla in
campi: @T2 individua il nome della legge e la descrizione della stessa (es. L.
13 maggio 1999, n.), @NLE individua il numero della legge (es. 524),
@PCAP e @CAP individuano i capi, i titoli e le sezioni della legge, @ART
individua il numero dell’articolo e @DART la rubrica e, infine, @TES il
testo dell’articolo; lo stesso dicasi per la giurisprudenza: infatti @TMAS
individua le titolazioni della massima, @MAS il testo della massima, @AST
gli estremi della massima e gli estremi di pubblicazione, @RN i riferimenti
normativi. Per quanto riguarda la dottrina le premesse sono diverse; infatti
tutti i documenti di dottrina contenuti nella banca dati in oggetto hanno
un’origine diversa, cioè non provengono dalla banca dati centrale della casa
editrice e pertanto si è dovuto trovare il modo di interpretare gli stessi ai fini
5
della loro indicizzazione, visualizzazione e digitalizzazione. I documenti di
dottrina provengono da Internet e da pubblicazioni cartacee e si è deciso di
“marcarli” utilizzando @VOC per individuare il titolo del documento e
@SUBVOC per individuare l’autore. Questi documenti, in quanto creati al
di fuori della banca dati della Casa editrice sono dei semplici documenti
aventi come estensione doc di Microsoft WORD, mentre i documenti di
legislazione e giurisprudenza provenienti dalla banca dati della casa editrice
hanno rispettivamente estensione leg e mas e possono essere aperti e salvati
solo come Testo MS-DOS , pena la perdita di tutte le vocali accentate. La
piattaforma che meglio si adatta alla interpretazione di dati di tale tipo è
senz’altro quella utilizzata dalla Casa Editrice La Tribuna per la realizzazione
della banca dati su cd-rom TuttoAmbiente in quanto prevede l’eccezione, in
fatto di provenienza, dei documenti di dottrina; l’utilizzo di tale piattaforma
per la creazione della banca dati su cd-rom in esame è stato gentilmente
concesso dalla stessa casa editrice.
Dopo aver risolto l’aspetto tecnico, si è passati alla ricerca del materiale. La
banca dati in questione consiste in tre archivi: Dottrina - Legislazione -
Giurisprudenza.
Le fonti da cui sono stati presi i dati sono essenzialmente tre: Internet -
Pubblicazioni cartacee - Banca dati centrale della Casa Editrice La Tribuna.
Internet è stato senz’altro molto sfruttato ai fini della creazione della suddetta
banca dati: infatti quasi tutti i pareri dottrinali sono stati presi dalla “Rete” e
ricercati all’interno della stessa utilizzando un classico motore di ricerca:
http://www.altavista.it/. Decisamente interessante per rapidità di ricerca è il
motore http://www.google.it/. Le parole chiave utilizzate per la ricerca su
Internet sono state: “Banche dati”, “Opere multimediali”, “Software”, “Tutela
giuridica del software”, “Tutela giuridica delle banche dati”, “Tutela giuridica delle opere
multimediali”; i risultati sono stati soddisfacenti in quanto si sono potute
“scaricare” alcune decine di documenti effettivamente riguardanti
l’argomento in questione. I siti internet maggiormente consultati durante la
ricerca sono stati fondamentalmente tre: http://www.degrazia.it/;
http://www.jei.it/; http://www.i-2000net.it/; ed altri in minima parte.
Una minima parte dei pareri dottrinali è stata reperita da pubblicazioni
cartacee, ad esempio la rivista Il diritto d’autore edita dalla Casa editrice Giuffrè,
Milano.
La fonte principale dei contenuti della presente banca dati è stata la banca dati
centrale della Casa Editrice La Tribuna, la quale ha rilasciato le autorizzazioni
necessarie.
Dalla banca dati de La Tribuna è stato facile attingere tutta la giurisprudenza
in materia di opere multimediali, software e banche dati con la
considerazione che, per quanto riguarda questi argomenti, le sentenze non
sono numericamente abbondanti; senz’altro esaustiva è stata la ricerca
riguardante la legislazione che ha permesso di estrarre la Costituzione della
Repubblica, tutta la codicistica riferentesi alla materia in questione, la
6
normativa nazionale e comunitaria in materia di banche dati, la normativa
nazionale e comunitaria in materia di diritto d’autore, la normativa nazionale
e autodisciplinare in materia di software.
1.2 La ricerca
La banca dati in questione è suddivisa in tre archivi Dottrina - Legislazione
Giurisprudenza. E’ possibile effettuare ricerche nei singoli archivi mediante
l’utilizzo di apposite maschere di ricerca che consentono di ricercare i
documenti che interessano mediante l’inserimento degli estremi oppure
selezionando la voce che interessa.
E’ sempre possibile la ricerca full-text, sia all’interno della maschera di ricerca
di un singolo archivio sia mediante l’utilizzo dell’apposita maschera prevista
dall’applicazione.
1.2.1 La Ricerca nei singoli archivi: I commenti di dottrina
Tale tipo di consultazione consente di ricercare solamente fra i documenti inseriti
nell'archivio Commenti, che contiene diverse decine di interventi di studiosi in materia di
tutela giuridica delle opere multimediali, del software e delle banche di dati.
Nella casella Voci si può selezionare l'argomento richiesto.
E' possibile inoltre effettuare ricerche Full - text (eventualmente abbinate ad altre) senza
uscire dalla schermata.
I tasti con i nomi degli Archivi consentono di passare velocemente alle altre schermate di
ricerca. Il tasto Ok conferma la ricerca effettuata; quello Annulla la annulla; quello Guida
rimanda alla guida in linea dell'applicazione; quello Pulisci pulisce la schermata di ricerca.
7
1.2.2 La ricerca nei singoli archivi: la legislazione
Tale tipo di consultazione consente di ricercare solamente fra i documenti
nell'archivio Legislazione, suddiviso ulteriormente nei due sub-archivi relativi,
rispettivamente, alla Codicistica, alla Legislazione nazionale e Cee.
La ricerca per Data consente di individuare una o più leggi digitando giorno,
mese ed anno nelle apposite caselle.
Nella casella Tipo si può selezionare la tipologia del provvedimento
legislativo.
Nella casella Numero si può specificare il numero della legge.
Nella casella Art. si può specificare il numero del singolo articolo richiesto.
E' possibile inoltre effettuare ricerche Full - text (eventualmente abbinate ad
altre) senza uscire dalla schermata.
E' possibile limitare la ricerca alla sola Codicistica, o alla sola Legislazione statale
e Cee.
Il tasto Ok conferma la ricerca effettuata; quello Annulla la annulla; quello
Guida rimanda alla guida in linea dell'applicazione; quello Pulisci pulisce la
schermata di ricerca.
1.2.3 La ricerca nei singoli archivi: la giurisprudenza
8
Tale tipo di consultazione consente di ricercare solamente fra i documenti
contenuti nell'archivio Giurisprudenza, contenente pronunce sia di legittimità
che di merito.
Nella casella Aut. giud. è possibile specificare quale autorità giudiziaria ha
emesso la pronuncia cercata (es.: Cass. civ.; ecc.).
E' poi possibile specificare, nelle singole caselle, la data, il numero, la voce, ed il riferimento
normativo delle sentenze cercate.
E' possibile, inoltre, effettuare ricerche Full - text (eventualmente abbinate ad
altre) senza uscire dalla schermata. Tale ricerca può riferirsi sia al testo delle
sole massime sia a quello dell'integrale motivazione.
Il tasto Ok conferma la ricerca effettuata; quello Annulla la annulla; quello
Guida rimanda alla guida in linea di questa applicazione; quello Pulisci pulisce
la schermata di ricerca.
1.2.4 La ricerca full-text e gli Operatori Booleani
Il termine booleano che spesso si trova quando si fanno ricerche in database
sia locali sia nel Web, si riferisce ad un sistema logico sviluppato dal
matematico inglese George Boole (1815-1864). La logica booleana consiste in
tre operatori logici:
• OR
• AND
• NOT
9
Nelle ricerche booleane, un operatore AND tra due parole o campi o valori
(es. “pera AND mela” oppure “Editore: Mondadori AND Autore:
Moravia”) significa che si stanno ricercando documenti contenenti entrambe
le parole o valori, non uno solo di essi.
L’operatore OR tra due parole o campi o valori (es. “pera OR mela) significa
che si stanno cercando documenti contenenti almeno una delle parole o
valori. Infine, l’operatore NOT tra due parole o campi o valori (es. pera
NOT mela) significa che si stanno cercando documenti contenenti la prima
parola o valore e non la seconda.
Ciascun operatore può essere descritto utilizzando i diagrammi di Venn, come di seguito
illustrato.
La figura di cui
sopra definisce l’operatore OR: Moravia or Mondadori, cioè tutti i titoli con
Moravia editi da chiunque e tutti quelli di Mondadori, non necessariamente
di Moravia.
Quest’altra figura definisce l’operatore AND: “Moravia and Mondadori”,
cioè tutti i documenti con Moravia ma editi da Mondadori.
10
Quest’ultima figura spiega l’operatore NOT: “Moravia not Mondadori”, cioè
tutti i documenti con Moravia editi, ma non da Mondadori.
1.2.5 Gli operatori di ricerca utilizzabili all’interno della
banca dati nella ricerca full-text
Come più sopra spiegato, le maschere di ricerca relative ad ogni archivio consentono
sempre la ricerca full-text, sola o abbinata ad estremi ben specifici.
E’ comunque prevista anche una maschera per l’esclusiva ricerca full-text mediante l’utilizzo
di specifici operatori di ricerca appositamente pensati per tale tipo di ricerca all’interno di
una banca dati costruita con CD Author della Dataware.
La maschera di ricerca di cui sopra permette di restringere o allargare la ricerca all’interno
della banca dati selezionando gli archivi che interessano e deselezionando quelli che non
interessano; nella box “Ricerca nel testo” si digitano i termini che devono condurre
all’individuazione dei documenti che si stanno cercando; in proposito si possono utilizzare
specifici Operatori di ricerca.
E' possibile, infatti, tramite l'utilizzo degli operatori di ricerca, combinare gli operandi in
modo da effettuare ricerche più raffinate.
11
E' altresì possibile utilizzare un operatore di ricerca come singolo termine da ricercare
digitandolo tra virgolette (es. "VICINO").
Gli operatori disponibili sono:
E
O
NON
VICINO
* (Asterisco)
? (Punto interrogativo)
( ) parentesi tonde
L'operatore di concatenazione E richiede che tutti gli operandi specificati siano presenti
contemporaneamente all'interno dello stesso documento. L'operatore E è anche l'operatore
di default, nel senso che in caso di assenza di operatori tra i termini, il sistema lo inserisce in
modo automatico.
L'operatore di concatenazione O richiede che almeno uno degli argomenti specificati sia
presente all'interno del documento.
L'operatore NON, inserito tra due operandi, richiede che il primo sia presente nel
documento senza che sia presente il secondo argomento specificato.
L'operatore VICINO richiede che tutti gli operandi specificati siano presenti
contemporaneamente all'interno dello stesso documento distanziati al più da un numero X
di termini. Il sistema imposta la distanza massima per l'operatore vicino a 3 termini. E'
comunque possibile aumentare o diminuire la distanza per ottenere di volta in volta ricerche
più mirate, specificando tale numero (ad es VICINO6) senza spazi.
Oltre agli operatori di concatenazione, è possibile inserire tra gli argomenti di ricerca le
parentesi tonde ( ) per modificare l'ordine di priorità nell'esecuzione.
L'operatore * (Asterisco) sostituisce qualsiasi numero di caratteri nel termine ricercato. Può
essere messo all'inizio, nel mezzo o alla fine del termine ricercato. Non è possibile utilizzarlo
per più di 2 volte per singolo termine.
L'operatore * può essere usato da solo oppure in una combinazione qualsiasi con uno degli
operatori di concatenazione descritti in precedenza.
L'operatore ? (Punto interrogativo) sostituisce un singolo carattere nel termine ricercato. Può
essere ripetuto ed inserito ovunque nel termine ricercato.
L'operatore ? può essere usato da solo oppure in una combinazione qualsiasi con uno degli
operatori di concatenazione descritti in precedenza.
12
2. PARTE SECONDA: LA CONVERSIONE DEI DATI
Introduzione
Il programma Convert è stato pensato per automatizzare, almeno in parte, il
processo di conversione dei dati dal formato originario (in questo caso
Ventura e documenti Microsoft Word) al formato finale leggibile dall’
interfaccia del CD-Rom.
La conversione avviene in più passi successivi, attraverso formati intermedi e
differenti a seconda della tipologia dei documenti trattati.
Il programma si avvia con un doppio click sull’icona ‘AR - Convert’ del
desktop e l’intero processo di interpretazione e creazione della banca dati si
riduce all’esecuzione di nove singoli passi guidata dall’interfaccia. I passi
sono: “Selezione progetto”, “Configurazione progetto”, “Configurazione indici”, “Inizio
13
elaborazione”, “Visualizzazione logfile”, “Creazione indici progetto”, “Reader Indexer
Binder - preparazione file”, “Reader Indexer Binder - caricamento” e “Costruzione liste”.
La sequenza dei passi da lanciare è preordinata e l’utente può navigare
attraverso questa sequenza cliccando sui bottoni “Prossimo ->” e “<-
Precedente”. Il bottone “Termina” permette di concludere la sessione di lavoro.
L’attivazione dei singoli passi può essere spezzata in più sessioni di lavoro
differenti.
Qualsiasi selezione o valore indicato nei controlli dell’intero programma
viene memorizzato e mantenuto in tutte le sessioni di lavoro. Questo
accorgimento permette di configurare l’intera applicazione una sola volta per
tutte e sfruttare sempre le informazioni proposte in automatico.
In ogni pagina il riquadro a fondo grigio in alto viene utilizzato per dare
all’utente suggerimenti e informazioni supplementari e per permettere la
visibilità dello stato delle operazioni nelle pagine in cui vengono avviati passi
di interpretazione che impegnano tempi lunghi.
La costruzione della banca dati avviene sostanzialmente in due fasi:
1) Una prima fase interpreta i files sorgenti che rappresentano i
provvedimenti in formato Ventura e Microsoft Word e crea una serie di file
in un formato intermedio di caricamento. Viene generato un file per ogni
documento visualizzabile dall’interfaccia, quindi in generale più di un file
per ogni file Ventura e Word.
2) Una seconda fase, gestita dal RIB di Dataware, partendo dai file preparati
in formato di caricamento, genera la banca dati vera e propria, costituita
da pochi file di dimensioni piuttosto consistenti, in formato proprietario e
accessibili da CDAuthor (Dataware) o dall’interfaccia dei CD-Rom.
Nella prima delle due fasi, oltre ai file spezzettati in formato di caricamento,
vengono generati dei file di elenco che indicano i nomi stessi di questi file.
L’elenco è necessario perché il RIB di Dataware per costruire la banca dati
finale ha bisogno di conoscere la lista di tutti i file sorgente in formato di
caricamento che la compongono. Nella pagina “Reader Indexer Binder -
preparazione file” viene lanciata la creazione della lista unica a partire dalle
sottoliste accumulate nei passi precedenti.
Nelle pagine che seguono verranno spiegate, in modo più dettagliato, le varie
fasi che conducono alla creazione finale della banca dati.
14
2.1 Selezione progetto
Il primo passo previsto è la selezione del progetto che interessa: pertanto,
avendo a disposizione una certa quantità di dati relativi ad una determinata
materia giuridica, essa dovrà essere interpretata al fine della creazione della
banca dati finale (Figura 1). I controlli in questa pagina sono:
Progetto - E’ una combo box che elenca tutti i progetti per cui è attivabile un
processo di interpretazione. L’utente deve selezionare il progetto per cui sta
effettuando l’interpretazione (in questo caso Prototipo).
Logfile - E’ una edit box in cui viene indicato il pathname del file di log utilizzato
dall’applicazione. Va qui indicato il pathname completo del file che
l’applicazione utilizza per scrivere gli avvertimenti, i problemi incontrati e le
inconsistenze relative ai dati interpretati. Se il file è già esistente viene
cancellato, se non esiste viene creato. In ogni caso la directory dove si trova
deve esistere.
15
2.2 Configurazione progetto
L’interpretazione dei dati per il progetto selezionato a nella pagina
precedente va configurata (Figura 2). I controlli in questa pagina sono:
Tipologia di documento - E’ una combo box che elenca le tipologie di documento
da trattare. Il contenuto di questa combo box dipende dalla selezione fatta a
pagina 1 relativamente al progetto da trattare, ogni progetto infatti considera
insiemi di tipologie di documento differenti. Per un progetto relativo a tutto
il diritto penale, ad esempio, la lista potrebbe comprendendere: Legislazione
Speciale, Codice Penale, Codice di Procedura Penale, Giurisprudenza della Legislazione
Speciale, Giurisprudenza del Codice Penale e Giurisprudenza del Codice di Procedura
Penale. L’associazione tra progetto e tipologie relative è registrata nel file
convert.ini dove un utente esperto informatico potrebbe modificare questa
impostazione. In questo caso si desidera creare un progetto (Prototipo di banca
dati su cd-rom in materia di tutela giuridica del software) in cui le tipologie del
documento sono tre: Dottrina, Legislazione (al cui interno prevedere la suddivisione
tra codicistica, legislazione statale e legislazione CEE) e Giurisprudenza.
Nome banca dati - E’ una combo box che elenca i nomi per le banche dati da
produrre. I nomi delle banche dati sono registrati nel file convert.ini e l’utente
può solo selezionare uno dei valori proposti e non assegnare un nuovo
nome. I valori presentati nella lista non dipendono dal progetto trattato, è
quindi importante selezionare per ogni progetto il nome che l’interfaccia si
aspetta di trovare per la banca dati; in questo caso il nome della banca dati è
stato volutamente definito Tpro.