6
La trattazione è organizzata nei seguenti capitoli:
CAPITOLO 1:
importanza delle informazioni in ambito aziendale e traduzione dei dati in conoscenza nell’ambito del
management;
introduzione dei concetti di base della Business Intelligence;
illustrazione dell’architettura di un sistema di Business Intelligence;
esposizione delle tecniche e metodologie capaci di estrarre da moli di dati, informazioni e tradurle in
conoscenza.
CAPITOLO 2:
presentazione della piattaforma Pentaho. Analisi degli strumenti messi a disposizione e delle funzio-
nalità di Business Intelligence che offre;
analisi dei due tool maggiormente utilizzati in azienda per progettare, sviluppare e schedulare reporti-
stica.
CAPITOLO 3:
descrizione dettagliata del deploy della piattaforma;
illustrazione delle soluzioni approntate per soddisfare le esigenze e le policy aziendali
documentazione di tutte le configurazioni e le modifiche apportate alla piattaforma per raggiungere
l’obiettivo desiderato.
CAPITOLO 4:
presentazione di alcuni esempi di soluzioni di business intelligence approntate in azienda, frutto del
lavoro svolto durante il periodo di tirocinio.
Presentazione aziendale:
Ebilling è la società leader in Italia per lo sviluppo e l’esercizio di soluzioni evolute di comunicazione persona-
lizzata verso la clientela, facendo proprie le esigenze di innovazione e di competitività richieste dal mercato.
Costituita nel marzo del 2001, Ebilling è cresciuta soprattutto nell’ambito dell’offerta di servizi in outsourcing
relativi a processi di generazione documentale sia in modalità “batch” (estratti conto, lettere contabili, fatture,
comunicazioni ai cittadini, etc…) che “on line” (lettere di caring prodotte da un CRM, contratti prodotti da un
front office, etc…).
L’approccio perseguito ed il posizionamento di Ebilling è volto ad offrire alle aziende servizi e competenze che
possano essere erogate sia in modalità ASP che in House (presso il cliente).
Nel 2009 il fatturato è stato di 11,3 mln euro mentre il forecast per il 2010 è di 12,7 mln euro.
Gli assets e le competenze di Ebilling risiedono sia nell’area della System Integration che nell’area
dell’Application Management e del BPO (processi E2E, incluso printing&delivery).
7
Le applicazioni attive sono suddivise tra i mercati Telco, Utilities, Finance e Industry e PAL/Sanità per un totale
di oltre 300 mln di documenti stampati e oltre 120 milioni di documenti in conservazione sostitutiva.
1.1 Business Intelligence
Il termine Business Intelligence fu introdotto per la prima volta nel 1985 da un ricercatore dell’IBM, Hans Peter
Luhn, in un saggio, scritto per la rivista IBM System.
In questo giornale, il termine intelligence fu definito come l’abilità o la capacità di cogliere le interrelazioni dei
fatti presentati, in modo da orientare l’azione verso l’ottenimento di un certo obiettivo. Questa rivista segna il
punto di partenza dello sviluppo della Business Intelligence (BI), fino a come è conosciuta oggi.
La definizione data da Luhn rimane valida fino al 1993, quando Gartner Analyst Howard Dresner ridefinisce il
termine business intelligence come l’insieme dei concetti e metodi per migliorare le decisioni basandosi su si-
stemi di supporto che riportano dati di fatto. Il concetto di business intelligence è proprio questo, un insieme di
metodi, modelli e strumenti con l’obiettivo di essere a supporto delle decisioni strategiche per realizzare gli o-
biettivi preposti.
La business intelligence si sviluppa maggiormente in quelle realtà aziendali dove si opera su grandi moli di da-
ti e dove è necessario tradurre l’insieme di dati in informazione utile. Molte organizzazioni ed aziende, infatti,
accumulano ingenti quantità di dati, provenienti in parte da transazioni interne, di natura amministrativa, logi-
stica, commerciale ed in parte anche da fonti esterne. Anche se raccolti e conservati in maniera strutturata e
sistematica, questi dati non sono direttamente utilizzabili nell’ambito delle decisioni. Occorre, infatti, che ven-
gano sottoposti a strumenti di analisi e di elaborazione, perché siano tradotti in informazione. La business
intelligence mette a disposizione tecniche e metodologie proprio a questo scopo.
Dunque, oltre che un concetto, la BI è un vero e proprio processo; si parte dalla raccolta di dati eterogenei fino
ad arrivare alla produzione di soluzioni a supporto della “making decision”, adottando per ogni fase tecniche e
metodologie differenti.
La figura n.1 presenta l’architettura tipica di un sistema di business intelligence, che può essere suddiviso in
vere e proprie fasi:
8
Figura 1 - Business Intelligence process
- Data Sources: una raccolta di dati a supporto del business, con caratteristiche fortemente operative.
È caratterizzata da scarsa leggibilità. I dati di per se stessi costituiscono poco più che dei simboli. Inol-
tre presentano fonti eterogenee. Anche se nella totalità contengono informazione, non esplicitano co-
noscenza. Possono anche essere dati non strutturati, quali email, dati acquisiti esternamente da a-
genzie e istituti economici;
- Data Warehouse(Magazzino): si tratta di una base dati separata dal sistema gestionale, strutturata
per contenere una replica parziale del sistema informativo aziendale in un formato che renda ottimale
l’analisi delle informazione (database preposti alle analisi di business intelligence).
Affinché i dati siano di supporto al business, vengono estratti dal database e attraverso procedure di
ETL (Extraction Transform Load) vengono selezionati quelli di interesse, normalizzati, trasformati (tra-
duzione di dati codificati, derivazione di nuovi dati calcolati, join tra dati recuperati da diverse tabelle,
aggregazione) . I risultati dell’estrazione vanno a popolare la data warehouse.
Spesso essa viene suddivisa in più sottoinsiemi logici chiamati data mart o anche cubi OLAP
2
.
Quest’ultimo rappresenta un’estrazione del DW, mantiene le stesse regole di progettazione e può
anch’esso contenere dati aggregati e di livello base, a seconda delle specifiche richieste degli utilizza-
tori; è progettato per rispondere ad una particolare funzione, marketing, finanza, etc.
2
OLAP On-Line Analytical Processing insieme di tecniche software per l’analisi interattiva e veloce di grandi quantità di dati. LA co-
struzione di Cubo Olap permette l’anali multidimensionale dei dati superando un limite dei database relazionali
9
Figura 2 - Datawarehouse
- Data Exploration (Esplorazione dei dati): a questo livello si collocano gli strumenti per le analisi di ti-
po passivo, che consistono in sistemi di interrogazione e reporting. Sono di tipo passivo perché si
prevede che il decision maker abbia preventivamente formulato una ipotesi e secondariamente faccia
utilizzo di questi strumenti per cercare risposte e verifiche al proprio modello mentale;
- Data Mining (Modelli di apprendimento): questo livello corrisponde alle metodologie attive di busi-
ness intelligence. Ha l’obiettivo di estrarre informazioni e conoscenze dai dati tramite modelli matema-
tici di apprendimento e tecniche di data mining. A differenza del livello precedente, non si richiede che
sia stata formulata una ipotesi. Questi, infatti, sono strumenti utilizzati per espandere la propria cono-
scenza;
- Data presentation: presentazione dei dati, dei risultati, tramite dati sintetici, reports grafici, web-
browser (interfaccia comune per diverse applicazioni di BI);
- Making Decision: Al vertice della piramide si colloca l’ultima fase, ovvero la fase di scelta e adozione
di una decisione. Nonostante l’utilizzo di un sistema di business intelligence, il decision maker potrà
integrare i risultati ottenuti con informazioni in suo possesso e prendere la decisione che ritiene vin-
cente.
L’output di questo processo è la traduzione della mole di dati iniziale in informazioni, e la presentazione
delle stesse ai knowledge worker
3
, offrendo un supporto decisivo e reattivo nell’ambito delle decisioni. I
decision maker potranno integrare i risultati così ottenuti con notizie informali e non strutturate in loro pos-
sesso per raggiungere definitivamente ad una conclusione.
Attualmente le soluzioni di Business Intelligence disponibili sono tante e possiamo suddividerle in due ca-
tegorie: prodotti proprietari (a pagamento) e prodotti appartenenti al mondo dell’Open Source (gratuiti).
3
Si riferisce all’insieme delle persone che in ambito aziendale operano le making decision, detti anche decision maker.
10
Tra i prodotti proprietari ne riporto i più conosciuti:
- SAP BusinessObjects;
- Microsoft Business Intelligence;
- MicroStrategy Reporting Suite;
- Oracle Business Intelligence Suite Enterprise Edition Plus;
- IBM Cognos Business Intelligence;
- SAS;
- DataTime Enterprise;
- QlikView QlikTech;
- InformationBuilders WebFOCUS Business Intelligence.
Tra i prodotti Open Scource cito i più diffusi:
- Pentaho Community Edition;
- RapidMiner;
- SpagoBI;
- Eclipse BIRT Project;
- JasperSoft.
Negli ultimi anni sempre più aziende si affacciano al mondo dell’Open Source. In primis perché essendo gra-
tuiti abbattono i costi di adozione di un software proprietario e anche perché spesso offrono le stesse funzio-
nalità e prestazioni. D’altro canto, la adozione di software Open Source comporta l’insorgenza di difficoltà tipi-
che dell’adozione di un software gratuito, ovvero: la mancanza di supporto, difficoltà ad adattare la soluzione a
specifiche situazioni aziendali, difficoltà a configurare l’applicazione e porre rimedi a malfunzionamenti a causa
della mancanza di una accurata documentazione.