11
dell’organizzazione a diffondere e condividere il proprio sapere e rendere disponibili mezzi
informatici affinché queste informazioni siano archiviate e rese disponibili con la massima
efficacia. Diventa quindi importantissimo per l’azienda moderna il riuscire ad immagazzinare
al meglio le informazioni, i documenti, i contenuti in se e riuscire ad renderli riutilizzabili. Per
cercare di raggiungere questo obbiettivo è necessario però spostare la nostra attenzione sui
sistemi di salvataggio e ricerca della documentazione aziendale disponibile perché non
sempre i sistemi attualmente a disposizione sono in grado di recuperare nel vasto oceano di
documentazione aziendale ciò che veramente ci interessa poiché basati su sistema di ricerca
libera nel testo e questo può rendere molti risultati non attinenti e nasconderne altri invece di
elevato interesse. Negli ultimi anni è sempre più cresciuta la necessità di rendere centralizzata
la gestione dei documenti che ogni organizzazione produce e consulta quotidianamente. Fino
ad oggi, gli sforzi sono stati concentrati sull’organizzazione efficace ed efficiente dei dati. La
realtà delle organizzazioni, però, è evidentemente troppo complessa per essere rappresentata e
gestita solamente per mezzo di dati. Per questo motivo, stanno prendendo piede sistemi
software atti esattamente allo scopo di mantenere centralizzata tutta la gestione dei documenti,
in qualunque forma e per qualunque fine.
Per migliorare il sistema di ricerca di questi sistemi, l’idea è di sfruttare i metadati e le
ontologie del settore di riferimento per creare un sistema di ricerca più efficace, questo
richiederà un maggiore sforzo in fase di inserimento ma renderà il sistema di ricerca
estremamente più efficace. Un metadato, letteralmente "dato su un ( altro ) dato", è
l'informazione che descrive un insieme di dati, nel nostro caso descriverà le parole chiave del
contenuto. I campi di una collezione di metadati sono costituiti da informazioni che
descrivono le risorse informative a cui si applicano, con lo scopo di migliorarne la visibilità e
facilitarne l’accesso. I metadati infatti permettono il recupero di documenti primari indicizzati
attraverso le stringhe descrittive contenute in record: schede in cui vengono rappresentate le
caratteristiche più significative o le proprietà peculiari dei dati in questione, così che la loro
essenza possa essere catturata da un’unica concisa descrizione, che, in modo sintetico e
standardizzato, fornisce a sua volta una via di recupero dei dati stessi. Esistono varie tipologie
di metadati tra cui i metadati descrittivi che servono per l’identificazione ed il recupero degli
oggetti digitali ; sono costituiti da descrizioni dei documenti fonte, o dei documenti nati in
formato digitale, risiedono generalmente nelle basi dati dei sistemi di Information Retrieval
all’esterno dell’archivio digitale, e sono collegati a quest’ultimo tramite appositi collegamenti.
L’obbiettivo sarà quindi riuscire ad associare ad ogni documento salvato in un CMS (Content
Management System) dei metadati che mi renderanno più efficace la ricerca, questi saranno
12
suggeriti attraverso un’ontologia del settore che aiuterà l’utilizzatore a scegliere per ogni
contenuto le giuste parole chiave.
Per creare questo sistema di ricerca basato sui metadati si è modificato uno dei programmi
CMS Freeware più comuni ed utilizzati, “Alfresco©”, che attualmente utilizza un sistema di
ricerca libero sul testo dei documenti in esso inseriti.
Nei primi capitoli ci occuperemmo di vedere in dettaglio l’obbiettivo che ci poniamo ed
analizzare i metadati, le ontologie ed alcune metodiche per crearle, il linguaggio Owl ed i
sistemi CMS. Nel capitolo sei, il cuore di questo lavoro, vedremo nel dettaglio come il nostro
obbiettivo è stato raggiunto e le modifiche apportate al programma sopracitato.
13
1
RICERCA SEMANTICA
IN AMBIENTE
DOCUMENTALE
1.1 Introduzione alla gestione della conoscenza
In un'azienda, lo sviluppo e mantenimento di un bene di consumo complesso ed altamente
tecnologico (elettrodomestici, automobili,...) comporta la generazione di una gran quantità di
informazioni fortemente correlate per descriverne attività e risultati conseguiti, progettare ed
organizzare la produzione e la logistica, supportare la rete commerciale e di assistenza post
vendita : indagini di mercato, requisiti utenti, specifiche tecniche, pianificazione attività,
progetto dei diversi sistemi e sotto sistemi meccanici, elettrici ed elettronici, vincoli
legislativi, progetto ed allestimento degli impianti produttivi, organizzazione della logistica,
report di sperimentazione e test, verbali di riunione, sono solo alcuni di questi.
Tutti questi documenti insieme alle norme, ovvero la formalizzazione, sulla base
dell’esperienza, di criteri guida nello svolgimento di specifiche attività (dalla pianificazione di
un nuovo sviluppo ai criteri per la progettazione delle singole componenti), rappresentano la
conoscenza aziendale che, debitamente conservata ed organizzata (Gestione della conoscenza
o knowledge management in inglese), costituisce lo strumento più importante per migliorare
14
l’efficacia e l’efficienza dei processi. L’effettiva capitalizzazione dello sforzo profuso nella
loro compilazione è assicurata solo se si garantisce il semplice e rapido reperimento delle
informazioni d’interesse per, ad es.:
ξ Recuperare le esperienze già fatte in occasione di un nuovo sviluppo
ξ Modificare/aggiornare prodotti preesistenti
ξ Analizzare eventuali malfunzionamenti
ξ Confrontare diverse opzioni progettuali
ξ Fidelizzare la clientela
ξ Valutare i fornitori (collegata al riutilizzo dell’informazione recuperata)
ξ Campagne pubblicitarie (collegata al riutilizzo dell’informazione recuperata)
L’utilizzo del documento come unità minima elaborata appare particolarmente limitativo,
soprattutto quando si ha a che fare con contenuti molto complessi e ricchi che
richiederebbero, invece, una risoluzione più fine per semplificare il reperimento e la
correlazione automatica delle informazioni. Questa situazione è particolarmente sentita
soprattutto dove il progresso tecnologico induce lo sviluppo di apparati “intelligenti” (ovvero
ricchi di contenuti e funzionalità). Rappresentazione, gestione, condivisione e crescita della
conoscenza sono i termini che caratterizzano le scelte di molti paradigmi computazionali
innovativi, che hanno molto in comune con la tradizione imprenditoriale, caratterizzata a sua
volta da un altissimo livello di creatività. La capacità di creare, conservare, gestire e innovare
conoscenze di alto valore e la loro messa in azione organizzata, insieme ad idee organizzative
ad alto impatto innovativo, sono e saranno i fattori su cui si giocheranno nuove forme di
progresso produttivo.
Fig. 1.1: Fasi della trasformazione dei dati in conoscenza
15
Si può inoltre distinguere tra la conoscenza “esplicita”, che può essere catturata e codificata
nei manuali, nelle procedure e nelle regole, e quindi è facile da diffondere, e quella “tacita”, la
quale non può essere facilmente articolata, e quindi esiste solo nelle mani e nella mente degli
individui.
Attualmente non è disponibile una risposta unica alla Gestione della Conoscenza, ma esistono
soluzioni più o meno parziali con sistemi quali :
ξ Product/Process Data Management (PDM) - utilizzati nei dipartimenti di ingegneria e
progettazione delle aziende manifatturiere per controllare il processo di sviluppo
attraverso la gestione dei risultati prodotti (distinta base, controllo di versioni, ticket di
modifica, dati CAD/CAM/CAE, gestione del workflow, specifiche, testing,…), al fine
di centralizzare e potenziare la circolazione delle informazioni e abilitarne la
tracciabilità.
ξ Supply Chain Management (SCM) - utilizzati per organizzare e riconfigurare
dinamicamente la rete dei rifornimenti agli stabilimenti produttivi in funzione della
localizzazione, disponibilità, capacità e tempi d’approvvigionamento dai singoli
fornitori, della fluttuazione delle richieste del mercato, … per minimizzare i tempi
d’inattività dovuti a mancanza di materiale, o i costi di gestione di un magazzino ( just
in time production).
ξ Customer Relationship Management (CRM) - utilizzati dalle grandi aziende per
raccogliere tutti i dati ritenuti necessari per capire la propria clientela e anticiparne i
bisogni, così da poter programmare adeguati interventi sulla gamma dei prodotti
offerti, sulle capacità di produzione, sul marketing e sulle attività di supporto alla
vendita.
ξ Enterprise Resource Planning (ERP) - utilizzati dalle aziende per meglio gestire e
pianificare la produzione, l’approvvigionamento, i magazzini, le relazioni con i
fornitori e con i clienti, gli ordini.
A queste soluzioni occorre aggiungere la miriade di sistemi informativi più o meno sviluppati,
ottenuti attraverso forti personalizzazioni di sistemi commerciali o ad hoc, che risolvono
specifiche problematiche proprie delle risorse umane, della gestione della documentazione,
della registrazione dei risultati di sperimentazione o di utilizzo di particolari apparati, etc.
16
Un Knowledge Management System (KMS) è un ambiente integrato che utilizza le tecnologie
di supporto ai processi di gestione della conoscenza per permettere alle organizzazioni di
sfruttarne i vantaggi.
Fig. 1.2: La conoscenza come risultato della contestualizzazione e dell’interpretazione dei dati
Fig. 1.3: Struttura di un KMS