vSommario
Un sistema di data warehousing e` una collezione di dati, ottenute da diverse fonti, a
supporto del processo decisionale; dal punto di vista pratico si tratta di una base dati
separata rispetto a quella del sistema gestionale, strutturata per contenere una replica
parziale dei dati contenuti nel sistema informativo aziendale in un formato che renda
ottimale l’analisi delle informazioni. In una visione piu` generale, un data warehouse e`
un sistema costruito al solo scopo di aiutare le aziende a trasformare i molteplici dati
presenti nei sistemi gestionali in informazioni effettivamente utili a supportare il processo
decisionale.
Negli ultimi anni il contesto in cui si trovano a lavorare i decisori all’interno delle aziende
e` divenuto sempre piu` complesso. Il contesto di mercato in cui molte aziende si trovano a
lavorare cambia a velocita` impensabili fino a pochi anni fa, con conseguente necessita` di
un numero crescente di informazioni in tempi sempre piu` stringenti. Nel contempo si e`
visto un continuo aumento del numero e della complessita` dei sistemi gestionali presenti
nelle aziende che se da un lato rende disponibili piu` informazioni, dall’altro allunga i
tempi necessari alla loro estrazione e crea una potenziale molteplicita` di definizioni, con
conseguente sovraccarico degli uffici IT.
Il data warehouse e` una delle soluzioni che sempre piu` aziende stanno adottando per
rispondere a queste esigenze:
• trasformare i dati in informazioni;
• rendere disponibili le informazioni giuste al momento giusto alle persone giuste;
• consentire integrazioni tra fonti dati eterogenee;
• elevata profondita` storica e Indipendenza dai sistemi sorgente;
• pulizia dei dati e Certificazione dei dati a tutti i livelli;
• gestione per eccezioni dei processi aziendali.
In poche parole: il gestionale permette di gestire l’azienda, il data warehouse permette
di capire come la si sta gestendo.
ix
Presentazione dell’azienda
Sinfo One S.p.A. nasce il 1◦ settembre 2007, dalla Divisione Industria di Sinfo
Pragma e si rivolge, in particolare, alle medie aziende italiane fornendo soluzioni ERP
estese, consulenza direzionale, organizzativa, di processo e tecnologica nonche´ servizi di
system integration.
Flessibilita`, continui investimenti in ricerca e formazione e attenzione alle esigenze dei
clienti costituiscono le basi del suo progetto di sviluppo.
L’offerta ERP e` basata sulla piattaforma proprietaria Si Fides e sulla piattaforma Oracle
JD Edwards Enterprise One che Sinfo One completa con il proprio verticale per il Food
& Beverage.
Sinfo One opera su tutto il territorio nazionale attraverso un team di oltre 100 profes-
sionisti con esperienze nei diversi settori di mercato e profonde competenze sui relativi
processi specifici.
Grazie alla specifica conoscenza della piattaforma Oracle JDEdwards ed alle competenze
ed esperienze dei propri team di professionisti e` in grado di offrire soluzioni verticalizza-
te e integrate a Enterprise Content Managemet, Enterprise Performance Management e
Business Intelligenge.
Sinfo One e Oracle – una partneship vincente
Sinfo One e` Platinum Partner di Oracle e Oracle Accelerate Partner per il Food & Be-
verage; e` uno dei 20 partner Tier 1 in Italia e tra i primi tre partner a livello Europa per
xl’SMB (Small & Medium Business).
Il verticale di Sinfo One per il Food & Beverage e` entrato nella lista delle Oracle Accele-
rate Solutions, unico in Italia per il settore alimentare.
Esperienza e competenza
I professionisti Sinfo One hanno competenze estese e specializzate, sono attenti ai bisogni
dei clienti e abituati a lavorare con obiettivi ambiziosi.
Particolare attenzione, con divisioni e laboratori di ricerca (Isi Lab) dedicati, e` data a
tematiche di ECM, EPM, BI e SCM.
Sul fronte del Supply Chain Planning il team di esperti Sinfo One ha messo a punto
una metodologia proprietaria: Step (Sistemi Tecnologici di Pianificazione) che nasce da
know how, esperienza, efficienza e selezione delle migliori tecnologie.
Sinfo One numeri
Sinfo One ha chiuso il 2009 con un fatturato di 9 milioni, confermando lo stesso fatturato
del 2008, risultato buono se si tiene conto della particolare situazione di crisi che attra-
versa l’economia mondiale.
Per lo stesso motivo il budget 2010 prevede un mantenimento del fatturato (9 milioni) e
i dati dei primi mesi sono in linea con il budget.
Sinfo One SPA: Via Benedetta 77/a - 43122 Parma - Tel. 0521.9371, Fax 0521.775824
[email protected] - www.sinfo-one.it
1Il Data Warehouse
1.1 I dati e l’azienda
Le nuove tecnologie stanno cambiando il modo di lavorare, di apprendere e di comunicare
a livello globale, cio` ha un notevole impatto sull’economia e sulle imprese. La quantita`
di dati prodotti sta aumentando a ritmi impensabili fino a qualche anno fa; raccogliere,
interpretare e dare un significato a questi dati e` un aspetto di fondamentale importanza
per gestire e guidare le aziende all’interno di questi nuovi scenari.
Le persone acquisiscono conoscenze dalle loro esperienze, dalle competenze dei propri pari
e dall’analisi dei dati aziendali, dalla sintesi di questi elementi emergono nuove conoscenze
e nuove opportunita`.
Processi gestionali efficienti sono in grado di instaurare circoli virtuosi di generazione
di conoscenza e arricchimento dell’informazione disponibile. Tali circoli, in linea teorica,
generano un aumento delle prestazioni dei processi gestionali e dell’organizzazione nel suo
complesso. La costruzione dell’informazione ed il suo uso entro l’azienda puo` avvenire
attraverso tre stadi successivi [4, Destri07]:
4 Il Data Warehouse
• I dati sono generalmente caratterizzati da una serie di fatti discreti concernenti gli
eventi e il mondo. Sono materiale informativo ‘grezzo’, non ancora eleborato dal
ricevente. Presi singolarmente non hanno alcun significato e possono esistere sotto
qualsiasi forma, utilizzabile o non utilizzabile.
• Le informazioni sono il risultato finale di un lavoro di individuazione e contestua-
lizzazione dei dati ‘grezzi’. L’informazione conferisce un significato ai dati, grazie
al fatto che li pone in relazione reciproca e li organizza secondo dei modelli. Tra-
sformare i dati in informazioni significa organizzarli in una forma comprensibile,
presentarli in modo appropriato e comunicare il contesto intorno ad essi.
• La conoscenza e` informazione applicata, si compone anche delle esperienze ta-
cite, alle quali contribuiscono le idee, le intuizioni, i valori e i giudizi individuali.
Questo tipo di sapere ha una natura dinamica ed e` accessibile soltanto tramite la
collaborazione diretta e la comunicazione con esperti che ne sono depositari.
Si puo` desumere dalle definizioni appena riportate che la conoscenza non e` l’informazione,
ma, un elaborato di quest’ultima e non bisogna cadere nel facile errore di confondere i
due termini. Sono le persone (il capitale intellettuale) che operano in un’azienda ad ag-
giungere valore all’informazione, trasformando i dati ‘grezzi’ in vantaggi per il business;
accedere alle informazioni e condividerle e` solo l’inizio del processo di trasformazione del-
l’informazione in conoscenza.
Saper gestire l’informazione e` il vero problema delle aziende in questi ultimi anni dato
che esse devono cimentarsi con una mole di dati, notizie, numeri che hanno origine dal-
l’incessante sviluppo delle tecnologie informatiche e telematiche contribuendo a creare
una situazione di overflow. La vera evoluzione pero`, al di la` dei problemi creatisi con il
progresso della tecnologia, e` stata quella che ha permesso di tradurre i dati, quelli elemen-
tari (quelli che presi in se stessi non hanno un’importanza particolare), in informazioni,
cioe` in dati che opportunamente aggregati tra loro, forniscono una chiave di lettura ed
un’interpretazione della realta` utile per dare giudizi e prendere decisioni aziendali [22,
Boletti02].
1.1.1 I processi aziendali
Un processo aziendale e` caratterizzato da un insieme di attivita`, collegate tra loro, per
fornire un determinato output a partire da input definiti. L’output puo` essere un pro-
1.1 I dati e l azienda 5
dotto o un servizio e viene utilizzato da determinati clienti o utilizzatori. Il processo
aziendale nella sua esecuzione pu‘o richiedere l interazione con diverse fonti di informazio-
ni, anche nel corso della sua esecuzione. I processi vengono in generale descritti a diversi
livelli di dettaglio. Si pu‘o parlare di macroprocessi quando si tratta di processi comples-
si che al loro interno possono essere scomposti in altri sottoprocessi e attivit‘a [2, Batini01].
Figura 1.1: Schematizzazione del concetto di processo.
La Piramide di Anthony (Figura 1.2) o re una classi cazione dei processi aziendali in
base alla tipologia di attivit‘a coinvolte. Secondo Anthony i processi si suddividono in:
Figura 1.2: Classi cazione dei processi aziendali e delle attivit‘a che li compongono
secondo lo schema di Anthony.
processi direzionali (indicati anche come strategici) che consistono nella de nizio-
ne delle mission aziendale e dei conseguenti obiettivi strategici, nonche nella scelta
delle risorse necessarie per conseguirli e delle politiche aziendali corrispondenti;
6 Il Data Warehouse
• processi gestionali (indicati anche come amministrativi o manageriali) che con-
sistono nella programmazione delle risorse disponibili e nel controllo del consegui-
mento dei risultati in termini di efficienza ed efficacia;
• processi operativi che corrispondono in generale alla conduzione a regime dell’in-
sieme delle attivita` dell’organizzazione.
Questa classificazione si basa sull’evidenza che le attivita` appartenenti ad uno stesso tipo
di processo possiedono caratteristiche comuni in termini di informazioni necessarie per
supportare adeguatamente il loro svolgimento.
E` possibile individuare alcuni criteri che consentono di identificare tali caratteristiche [3,
Pigni09]:
• L’orizzonte temporale di riferimento, ossia la durata del periodo lungo il quale
avranno effetto le decisioni prese svolgendo tali attivita` o, in altri termini, l’inter-
vallo di tempo che intercorre tra due esecuzioni successive di una certa attivita`. Le
attivita` strategiche hanno influenza nel lungo termine, mentre le attivita` operative
hanno tipicamente un effetto immediato.
• L’orientamento all’esterno, ossia l’entita` dell’impatto che hanno le attivita` al
di fuori dei confini dell’organizzazione. Le attivita` strategiche hanno effetto sul
contesto competitivo in cui un’organizzazione opera, mentre le attivita` operative
hanno impatto limitatamente all’unita` organizzativa di appartenenza.
• La discrezionalita`, ossia il grado di arbitrio con il quale si puo` decidere come e
quando svolgere un’attivita`.
• La ripetitivita`, ossia la frequenza con cui un’attivita` viene svolta: l’elevata ripetiti-
vita` caratterizza i compiti operativi che di fatto sono i piu` facilmente automatizzabili
e controllabili.
• La prevedibilita`, correlata alla precedente, e` tipica delle attivita` operative, sia nel
senso che queste producono risultati prevedibili a priori, sia nel senso che e` noto a
priori quando e quali queste debbano essere eseguite. Vale tipicamente il contrario
per le attivita` strategiche.
Il modello di Anthony indica che per svolgere attivita` dello stesso livello e` necessario im-
piegare informazioni dello stesso tipo. La Tabella 1.1 illustra schematicamente i requisiti
1.1 I dati e l’azienda 7
informativi che tipicamente caratterizzano le tre tipologie di attivita`.
Analizzando le caratteristiche dei requisiti informativi citati risulta evidente come le at-
tivita` operative siano quelle maggiormente predisposte ad essere automatizzate, perche´
ripetitive, maggiormente strutturate, le cui modalita` d’esecuzione tipicamente non varia-
no nel tempo e che fanno uso di dati esatti. Quando vengono utilizzati per automatizzare
le attivita` operative, i sistemi informatici vengono classificati sotto il nome di TPS (Tran-
saction Processing Systems), o anche EDP (Electronic Data Processing).
Grazie all’evoluzione delle tecnonogie informatiche e agli strumenti di sviluppo del soft-
ware, e` stato possibile realizzare applicazioni a supporto delle attivita` tattiche, principal-
mente focalizzate sul controllo di gestione. Quando vengono utilizzati per automatizzare
le attivita` tattiche, i sistemi informatici vengono classificati sotto il nome di MIS (Mana-
gement Information Systems).
Infine, a partire dagli anni ’80, sono stati compiuti numerosi sforzi per sviluppare soluzio-
ni che supportassero adeguatamente le attivita` strategiche. A causa delle caratteristiche
di scarsa ripetibilita`, di utilizzo di dati poco strutturati e di informazioni esterne, spesso
soggettive, le attivita` di questo tipo sono difficilmente automatizzabili. Di conseguenza i
sistemi informatici non si focalizzano sull’automazione delle attivita` strategiche, ma sulla
fornitura delle informazioni necessarie a chi deve prendere decisioni strategiche. Quando
vengono utilizzati per supportare le attivita` strategiche e i processi decisionali, i sistemi
informatici vengono classificati sotto il nome di EIS (Executive Information Systems),
oppure di DSS (Decision Support Systems) [5, Ward02].
1.1.2 I flussi informatici e i flussi informativi associati ai pro-
cessi
L’identificazione e la descrizione dei processi di un’organizzazione permette di evidenziare
le relazioni tra diverse unita` organizzative, spostando l’attenzione dalle regole organizza-
tive di un’area ristretta agli obiettivi globali dell’organizzazione. Questa interfunzionalita`
delle rappresentazione per processi porta a descrivere i fabbbisogni informativi in modo
dettaglito e preciso, consentendo quindi di progettare un sistema informativo efficacie.
Si definiscono flussi informativi i flussi di informazioni che vengono traferiti tra devir-
se componenti di un’azienda (intra-aziendali) o tra l’azienda e i propri clienti/fornitori
(inter-aziendali). Ad ogni processo sono associati uno o piu` flussi informativi che trasmet-
8 Il Data Warehouse
Tipo di processo Prevalenza di
direzionale
- informazioni esterne
- dati prospettici stimati e approssimati
- informazioni anche non omogenee tra loro
- esigenze informative su dati interni
non prevedibili ne´ ripetitive
gestionale
- informazioni esterne
- dati omogenei e congruenti tra loro
- dati sintetici o arrotondati
- dati consultivi
- eleborazioni ripetitive e coerenti nel tempo
- esigenza di segnalare in tempo utile le
eccezioni e accedere su richiesta a
informazioni non preventivate
operativo
- dati esatti
- dati analitici
- esigenze informative in tempo reale
Tabella 1.1: Requisiti informativi e ruoli coinvolti nelle tre classi individuate dal modello
di Anthony.
1.2 Sistemi transazionali e sistemi di analisi 9
tono le informazioni tra le varie attivita` che formano il processo stesso e sono necessari
per il suo funzionamento.
Quando i flussi informativi vengono realizzati attraverso un canale digitale, trasferendo
dati direttamente tra strumenti informatici, senza intervento diretto di operatori umani,
se non con funzione di verifica o controllo, prendono il nome di flussi informatici [4,
Destri07].
1.2 Sistemi transazionali e sistemi di analisi
Nel paragrafo precedente e` stato evidenziato come processi gestionali e processi decisio-
nali necessitino, per il loro supporto, di sistemi informatici differenti. Di seguito saranno
definite le caratteristiche degli uni e degli altri sistemi, sottolineandone gli aspetti che li
contraddistinguono. E` bene precisare che, con il termine “sistemi transazionali” (oppure
anche sistemi operazionali) vengono indicati i sistemi a supporto dei processi operativi
e gestionali, con il termine “sistemi di analisi” invece, si indicano sistemi a supporto dei
processi decisionali-strategici.
Mentre i dati operazionali coprono un arco temporale di solito piuttosto limitato,
poiche´ la maggior parte delle transazioni coinvolge i dati piu` recenti, i sistemi di analisi
devono permettere elaborazioni che spazino sulla prospettiva di alcuni anni. Per questo
motivo questi sistemi sono aggiornati a intervalli regolari a partire dai dati operazionali.
Volendo fare un paragone possiamo supporre che, a intervalli regolari, venga scattata
una fotografia istantanea dei dati operazionali. La progressione delle fotografie scattate
viene immagazzinata, generando un film che documenta la situazione aziendale da un
istante zero fino al tempo attuale [12, Golfarellis]. Le principali differenze tra sistemi
transazionali e sistemi di analisi sono riassunti in Tabella 1.2.
1.2.1 Perche´ e` necessario distinguere
Dal momento che, in linea di principio, i dati presenti nel sistema di analisi non vengono
mai eliminati e che gli aggiornamenti sono tipicamente eseguiti “a freddo”, ossia quando il
sistema e` fuori linea, fa si che esso possa essere fondamentalmente considerato un database
a sola lettura. Questa caratteristica, insieme all’esigenza degli utenti di contenere i tempi
10 Il Data Warehouse
Sistemi Transazionali Sistemi di Analisi
utenti migliaia centinaia
carico di lavoro transazioni predefinite interrogazioni di analisi
accesso
centinaia di record milioni di record
in lettura e scrittura per lo piu` in lettura
scopo dipende dall’applicazione supporto alle decisioni
dati
elementari, di sintesi,
numerici e alfanumerici prevalentemente numerici
integrazione dei dati per applicazione per soggetto
qualita` in termini di integrita` in termini di consistenza
copertura temporale solo dati correnti dati correnti e storici
aggiornamenti continui periodici
modello
normalizzato denormalizzato,
multidimensioanle
ottimizzazione
sulle transazioni accessi analitici
su gran parte del database
sviluppo a cascata iterativo
Tabella 1.2: Differenze tra database operazionali e data warehouse.
1.2 Sistemi transazionali e sistemi di analisi 11
di risposta alle interrogazioni di analisi, produce importanti conseguenze a vari livelli.
Innanzitutto incide sulle tecnologie adottate dai DBMS specializzati per l’analisi: dal
momento che gli accessi sono eseguiti in sola lettura non sono piu` necessarie le tecniche
sofisticate di gestione delle transazioni richieste dalle applicazioni operazionali. Inoltre i
sistemi di produzione sono progettati per eliminare le ridondanze: i dati sono suddivisi in
diverse entita`, ognuna delle quali diventa una tabella all’interno dello schema relazionale.
Gli schemi normalizzati sono estremamente importanti nei sistemi transazionali in quanto
permettono di avere maggior sicurezza e performace: gli aggiornamenti e gli inserimenti
necessitano una sola operazione sul database.
Tuttavia questo modello risulta troppo complicato per eseguire interrogazioni di analisi
e i moderni DBMS non sono in grado di processare interrogazioni su schemi normalizzati
in modo efficiente.
1.2.2 Le caratteristiche di un DBMS transazionale (OLTP)
Lo scopo dei database transazionali, chiamati anche sistemi operazionali, o ancora, si-
stemi OLTP (On-Line Transaction Process) e` quello di reperire, memorizzare, elaborare,
trasmettere e presentare informazioni necessarie per il funzionamento dei processi di con-
trollo e operativi dell’azienda. Tali sistemi sono utilizzati contemporaneamente da piu`
utenti che accedono alla stessa base dati attraverso delle procedure predefinite e i dati
rispecchiano sempre una situazione aggiornata [24, Carrozzo08].
I sistemi transazionali sono sistemi che mettono a disposizione meccanismi per la defi-
nizione e l’esecuzione di transazioni. Una transazione identifica una unita` elementare
di lavoro svolta da un’applicazione. Tutto il codice che viene eseguito all’interno di una
transazione gode di proprieta` particolari: atomicita`, consistenza, isolamento e persistenza
(in inglese e` utilizzato l’acronimo ACID: “Atomicity, Consistency, Isolation, Durability”)
[6, Atzeni09]:
• L’atomicita` rappresenta il fatto che una transazione e` un’unita` indivisibile di ese-
cuzione; o vengono resi visibili tutti gli effetti di una transazione, oppure la tran-
sazione non deve avere alcun effetto sulla base di dati, con un approccio “tutto o
niente”. In pratica non e` possibile lasciare la base di dati in uno stato intermedio
attraversato durante l’elaborazione della transazione.
• La consistenza richiede che l’esecuzione della transazione non violi i vincoli di