Appunti relativi al corso informatico per le decisioni aziendali. La business intelligence si avvale della statistica e dei supporti informatici per essere efficiente e competitiva: vengono esplicitate modalità, modelli di riferimento e processi di individuazione, analisi e interpretazione dei dati.
Laboratorio informatico per le decisioni aziendali
di Valentina Minerva
Appunti relativi al corso informatico per le decisioni aziendali. La business
intelligence si avvale della statistica e dei supporti informatici per essere
efficiente e competitiva: vengono esplicitate modalità, modelli di riferimento e
processi di individuazione, analisi e interpretazione dei dati.
Università: Università Cattolica del Sacro Cuore di Milano
Facoltà: Economia
Esame: Laboratorio informatico per le decisioni aziendali
Docente: Mamino Massimo, Cantaluppi Gabriele1. Definizione di business intelligence
Il dato è la risorsa delle imprese. L’obiettivo è quello di utilizzare i dati per costruire, estrarre informazioni
che possono essere utili ai fini decisionali e che consentono all’impresa di sviluppare l’intelligenza
competitiva. Uno dei problemi legati al raggiungimento di questo obiettivo è il costo dei supporti di
memorizzazioni, per questo adesso sta tendendo a zero, per dimostrare che non è più incidente sul costo
totale.
Il fine del BI è quello di produrre conoscenza da utilizzare nei processi decisionali.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 2. Il contesto della business intelligence
In un quadro di radicale trasformazione del contesto socio – economico come quello attuale (società
dell’informazione), i processi di governo delle strutture a organizzazione complessa appaiono sempre più
condizionati dall’accesso alle informazioni per lo sviluppo di piani d’azione efficaci e la conseguente
generazione di un differenziale competitivo.
Per utilizzare i dati al fine di scoprire al loro interno delle tendenze, c’è bisogno di accumulare moltissimi
dati. Al fine di raccogliere i dati è necessario:
- disponibilità di tecnologie per la memorizzazione dei dati a basso costo, diffusione della connettività e
disponibilità di banda.
- Accesso alla mole di dati disponibili (nei repository aziendali) presso imprese e organizzazioni. Potrebbe
non essere sufficiente accedere a questi dati da un ufficio centrale. Non tutti i processi decisionali sono
accentrati.
Si parla di business intelligence a partire dagli anni ’90, quando l’informatica ha permesso di superare questi
problemi.
E’ possibile trasformare tali dati in informazioni e conoscenza utili nei processi decisionali : è diventato
operativamente possibile grazie allo sviluppo avvenuto nel settore dell’informatica.
La piattaforma informatica opportunamente addestrata con un modello matematico statistico è in grado di
essere applicata ai dati al fine di essere trasformata in informazione e conoscenza.
I dati provengono dai sistemi informativi aziendali. Anche in presenza di una piattaforma integrata di tipo
moderno, molto spesso i dati disponibili sono generalmente eterogenei (differenziati) per:
- origine,
- contenuto, non è detto che l’entità studente nel sistema amministrativo di università e nel sistema della
didattica siano rappresentati con gli stessi attributi.
- rappresentazione: varia l’unità di misura di rappresentazione del dato.
… dal momento che derivano da transazioni commerciali, finanziarie, amministrative e da altre fonti (anche
di natura personale) interne e esterne all’organizzazione.
Le problematiche da affrontare si sviluppano, quindi, lungo due direttrici:
1. predisposizione dei dati : attraverso i data warehousing;
2. trasformazione dei dati in informazione e conoscenza mediante strumenti di analisi.
Con il termine di business intelligence (Howard Dresner, 1989) ci si riferisce a “un insieme di modelli
matematici e metodologie di analisi che esplorano i dati per ricavarne informazioni e conoscenza utili nei
processi decisionali”.
Il dato, applicando certe tecniche e seguendo un processo preciso di sviluppo, viene trasformato in
informazioni e conoscenza.
Le metodologie sono i processi con i quali l’algoritmo viene applicato.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 3. Natura della business intelligence
Le metodologie di business intelligence hanno un’ampia portata applicativa e una natura interdisciplinare,
riguardando:
- tutte le organizzazioni complesse e i diversi ambiti di applicazione (portata applicativa). Non esiste
contesto organizzativo che non tragga beneficio dall’utilizzo di soluzioni di business intelligence. Poi il tipo
di tecnica e di intensità di utilizzo dipende dal contesto;
- la rappresentazione e articolazione dei processi decisionali (organizzazione, teoria delle decisioni);
- la raccolta, conservazione e gestione dei dati (data warehousing);
- i modelli matematici-statistici per l’analisi dei dati (statistica e ricerca operativa);
- le metodologie di natura empirica e le problematiche di automazione (informatica).
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 4. Approccio multidimensionale della business intelligence
Un ambiente di business intelligence offre ai knowledge worker strumenti e metodologie per prendere
decisioni efficaci e tempestive.
La business intelligence ha un approccio multidimensionale.
Un ambiente di business intelligence non cambia la struttura e le caratteristiche del processo decisionale
dell’azienda, ma ne fornisce un supporto. Il decisore, anche in assenza di strumenti automatizzati, si pone
domande sulla serie di dati a disposizione, fa delle analisi, valuta delle soluzioni alternative e assume delle
decisioni alternative. La business intelligence non cambia questa struttura, rimane sempre il problema di
valutare le soluzioni alternative. Il vantaggio di questa automazione è quello che oltre che alla possibilità di
dominare problemi caratterizzati da variabili non trattatibili, riesce ad analizzare più alternative, a trarre
conclusioni più precise perché più informate, perché i dati sono molto più ampi (serie storiche), riesce a
studiare fenomeni con profondità temporale. I processi decisionali non sono trasformati ma sono resi più
efficienti e più efficaci.
Problematiche che nei diversi contesti di mercato vengono risolti con problemi di business intelligence:
Ad esempio in un contesto universitario si può capire se all’interno dei profili degli studenti esistono delle
regolarità che consentono di dire perché uno studente arriva alla laurea o abbandona gli studi. Non è così
semplice, ma potrebbe essere un tipico problema. Si risolve con tecniche di classificazione: analizzo la storia
di strumenti passata, costruisco due gruppi di studenti, cerco di capire se esistono delle differenze nei loro
profili, tali da indurre che queste caratteristiche possono essere causa di abbandono.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 5. Esempi di decisioni efficaci e tempestive in ambito di business
intelligence
ESEMPIO 1 - BANCA
Per il lancio di un nuovo prodotto di investimento finanziario, al product manager di una banca si pone il
problema di individuare il segmento di clientela target a più elevato potenziale di acquisto, su cui pianificare
una campagna di promozione commerciale.
I sistemi di business intelligence consentono di risolvere il problema attraverso l’applicazione di tecniche di
classificazione e stima a partire dai dati relativi agli acquirenti di prodotti aventi caratteristiche similari.
ESEMPIO 2 – CARTE DI CREDITO
ESEMPIO 3 – TELEFONIA MOBILE
Al responsabile marketing di un operatore di telefonia mobile si pone il problema di sviluppare una
campagna di retention nei confronti della clientela caratterizzata dalla più elevata probabilità di abbandono
(churn).
I sistemi di business intelligence consentono di risolvere il problema attraverso l’applicazione di tecniche di
classificazione e stima, a partire dai dati (anagrafici e di traffico) relativi ai clienti che hanno abbandonato
l’azienda (previa definizione di cosa si intende per abbandono, ciò che in alcuni casi può presentare delle
difficoltà, soprattutto nel campo della telefonia mobile).
ESEMPIO 4 – GRANDE DISTRIBUZIONE ORGANIZZATA
Al responsabile della pianificazione marketing presso i punti vendita di una catena della GDO si pone il
problema di massimizzare il ritorno delle campagne di punto vendita.
I sistemi di business intelligence consentono di risolvere il problema attraverso l’applicazione di tecniche di
market basket analysis (basate su regole associative) agli acquisti effettuati da clienti anonimi (analisi dei
carrelli), con l’obiettivo di identificare associazioni interessanti tra prodotti acquistati e relativa frequenza.
Nel caso di clienti fidelizzati (tramite carta fedeltà), tali sistemi (serie storiche) possono essere utilizzati per
analizzare, oltre alle associazioni tra prodotti, anche le dinamiche temporali degli acquisti effettuati da
clienti nominativi, con l’obiettivo di pianificare efficaci campagne “one to one”.
ESEMPIO 5 – ELETTRONICA DI CONSUMO
Il responsabile commerciale di una catena dell’elettronica di largo consumo ha rilevato un incremento nelle
vendite di una determinata categoria di prodotti. Dal momento che tale incremento è caratterizzato da un
certo grado di discontinuità (su base geografica e temporale), emerge la necessità di indagare il fenomeno
per
intraprendere azioni appropriate a estenderlo e, eventualmente, stabilizzarlo.
I sistemi di business intelligence consentono di risolvere il problema attraverso l’applicazione di tecniche di
analisi multidimensionale (OLAP), eventualmente seguite da tecniche di analisi statistica, ai dati di vendita,
al fine di analizzare l’andamento in relazione ad un insieme di variabili coerenti (a) con gli obiettivi
dell’indagine, (b) con le ipotesi di indagine formulate dal responsabile commerciale.
L’analisi multidimensionale è un tipo di tecnica di tipo tradizionale che è rappresentabile come un cubo a
molte dimensioni, che consente di cambiare prospettiva di indagine a seconda di quale faccia del cubo si
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali guarda. Consente di analizzare un fenomeno in tutti i suoi aspetti in modo molto dinamica (questo si
potrebbe fare anche in una tabella di excel, ma sarebbe più complesso).
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 6. Differenza tra concetti di: dati, informazioni e conoscenza -
esempi
DATI : la codifica strutturata delle singole entità primarie e delle transazioni che coinvolgono due o più
entità primarie. Tutte le entità su cui si basa la vita di un’azienda: clienti, fornitori, dipendenti, ordini di
acquisto, ordini di vendita, ecc. Ad esempio la codifica strutturata di uno studente all’interno di un certo
contesto è un dato.
INFORMAZIONI : il risultato di operazioni di estrazione e elaborazione compiute a partire dai dati
(assumono significato in relazione ad un determinato contesto). La più banale è prendere il dato, estrarlo e
visualizzarlo. E così via.
CONOSCENZA : l’utilizzo di informazioni per l’assunzione di decisioni e lo sviluppo di azioni
conseguenti. L’utilizzo di informazioni elaborate a partire dai dati all’interno di un processo decisionale
viene chiamato conoscenza.
La CONOSCENZA può essere estratta dai dati in modo:
- PASSIVO : attraverso criteri di analisi suggeriti dal decision maker (in questa categoria ricadono i metodi
di analisi statistica classica, i sistemi di interrogazione e reporting inclusa l’analisi multidimensionale -
OLAP);
- ATTIVO : con l’ausilio di modelli matematici di apprendimento induttivo e di ottimizzazione (in questa
categoria ricadono la statistica inferenziale e i modelli di apprendimento induttivo, le tecniche di data
mining).
Negli strumenti di analisi reporting di tipo tradizionale è già chiaro il modello che utilizzo per fare l’analisi
dei dati. Se dico che voglio analizzare le vendite della penna per analisi geografica, ho già chiaro il modello
di interpretazione, voglio solo sapere quanto ho venduto. Quindi è passivo in quanto lo strumento riceve una
richiesta e risponde con un’informazione senza suggerire un modello di interpretazione della realtà.
Le metodologie attive suggeriscono un modello di interpretazione della realtà o del fenomeno che sto per
analizzare.
Per definire attivo o passivo dobbiamo vedere il ruolo del decisior maker: se questo ha un modello
precostituito di rappresentazione della realtà, lo strumento di business intelligence gioca un ruolo passivo, e
viceversa.
ESEMPIO 6 – APPROCCIO PASSIVO
L’analisi delle transazioni di vendita di una catena della grande distribuzione organizzata sulla base di
variabili quali il prodotto, la locazione del punto vendita e il periodo è un approccio passivo.
Presuppone, infatti, l’esistenza di un modello di analisi (tipicamente multidimensionale) sviluppato ex ante
da parte del decision maker.
ESEMPIO 7 – APPROCCIO ATTIVO
L’analisi del contenuto dei carrelli (market basket analysis) di una catena della grande distribuzione
organizzata per la ricerca di associazioni tra prodotti acquistati è una analisi di tipo attivo.
In questo caso, infatti, il decision maker non ha un’idea preventiva in merito alla eventuale presenza di
associazioni, alla regolarità con cui si presentano e ai prodotti implicati.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali ESEMPIO 8 – APPROCCIO ATTIVO
La classificazione dei clienti di una banca in gruppi omogenei (cluster analysis) sulla base di variabili
anagrafiche e socio-demografiche e la successiva ricerca di correlazioni con la tipologia di rapporti
intrattenuti è una analisi di tipo attivo.
In questo caso, infatti, il decision maker non ha un’idea preventiva delle variabili significative per la
separazione dei gruppi, né dei valori caratteristici di tali variabili nell’ambito dei diversi gruppi, né
dell’esistenza o meno di correlazioni tra i gruppi identificati e i prodotti della banca.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 7. Ruolo dei modelli matematici nella gestione organizzativa
Le analisi di business intelligence tendono a promuovere un orientamento scientifico e razionale nella
gestione delle organizzazioni.
Tale orientamento si basa su:
- individuazione degli obiettivi dell’analisi e definizione degli indicatori di prestazione che consentono di
valutare le diverse alternative;
- sviluppo di modelli matematici che pongono in relazione le variabili di controllo del sistema con i
parametri e le metriche di valutazione;
- svolgimento di analisi di tipo what if per determinare gli effetti sulle prestazioni determinati da variazioni
delle variabili di controllo e modifiche dei parametri.
Benefici derivanti da tale orientamento:
- lo sviluppo di un modello astratto per la rappresentazione di un fenomeno induce il decision maker a
concentrare la sua attenzione su aspetti rilevanti del contesto di analisi, sviluppando una comprensione più
approfondita del fenomeno;
- l’utilizzo di un modello matematico consente di trasferire più facilmente ad altri (e in modo più oggettivo)
la conoscenza acquisita in relazione al fenomeno analizzato.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 8. Definizione di modello nel contesto di gestione organizzativa
Nel nostro contesto, un modello può essere definito come una rappresentazione selettiva della realtà,
realizzata mediante l’utilizzo di un opportuno formalismo.
Il formalismo può essere quello matematico statistico, ad esempio la rappresentazione della dipendenza di
una variabile y= f(x). Ma i formalismi non sono solo matematico statistici, ad esempio di potrebbe valutare
che se è vera una certa condizione antecedente, allora è sicuramente vera un’altra condizione conseguente.
Rispetto a tutte le variabili utilizzabili per rappresentare una variabile di interesse devo fare una selezione
determinata dal contesto e dalla disponibilità degli strumenti.
Il data mining ha l’obiettivo di cercare se all’interno dei dati esistono delle particolarità che permettono di
analizzare i dati anche in chiave previsionale.
Il formalismo che utilizziamo può essere matematico, rigoroso (formule matematiche) o formalismi di tipo
più empirico, possiamo rappresentare un fatto attraverso una REGOLA, ossia dati dei valori, è possibile
concludere che potrà verificarsi una certa cosa.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 9. Architettura del sistema di business intelligence
Un modello di business intelligence si basa su un modello di architettura informatica. L’architettura
informatica è costituito da tre stadi:
La BI implica un’attività di elaborazioni di dati per la produzione di conoscenza, quindi il punto di partenza
è:
Fonti dei dati (primo stadio) si dividono in:
- individuazione, raccolta e integrazione dei dati provenienti da fonti primarie (sistemi ERP, altri sistemi
operazionali) e fonti secondarie (documenti non strutturati e dati personali, dati acquisiti esternamente).
La BI implica la trasformazione di dai in informazioni e conoscenza utili al supporto di processi decisionali.
Data warehouse e data mart (secondo stadio):
- i dati vengono estratti dalle fonti primarie, opportunamente trasformati e immagazzinati nei database
preposti alle analisi di business intelligence mediante strumenti detti ETL (Extract, Transform, Load);
- il contenuto di tali database può essere di tipo generalizzato (data warehouse) oppure specializzato per area
di indagine (data mart).
Il data warehouse è un serbatoio di dati che provengono dalle fonti primarie e secondarie, che subiscono un
processo di trasformazione a seguito della loro estrazioni, prima di essere caricati all’interno di questo
deposito (cambiando il modello logico). Questo perché per essere utili alle analisi di BI i dati devono essere
puliti, omogeneizzati, accumulati con una profondità storica. In questo modo cambia anche il modello di
rappresentazione dei dati.
A questo punto posso decidere se tenere insieme tutti i dati o se costruire dei piccoli serbatoi specializzati
per dipartimento, area, funzione aziendale. Questi si chiamano data mart.
Metodologie di business intelligence (terzo stadio):
- I dati vengono infine estratti dai data warehouse e data mart per alimentare i modelli matematici e le
metodologie analitiche di business intelligence.
- In un ambiente di business intelligence trovano collocazione le seguenti tipologie di applicazioni:
- analisi multidimensionale (OLAP);
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali - analisi esplorativa;
- analisi di serie storiche;
- modelli di apprendimento inferenziale (data mining);
- modelli di ottimizzazione.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 10. Componenti del sistema di business intelligence
Un altro modo per rappresentare l’architettura del sistema di business intelligence avviene attraverso la
piramide delle componenti. In questo modo possiamo valutare i ruoli e valutare quanto una componente
incide sullo stadio successivo.
ESPLORAZIONE DEI DATI:
- strumenti per le analisi passive di business intelligence (metodi di analisi statistica e sistemi di
interrogazione e reporting, inclusa analisi multidimensionale);
- richiedono al decision maker la formulazione di un’ipotesi preventiva (modello mentale) rispetto alla quale
si cercheranno, successivamente, risposte e conferme.
MODELLI DI APPRENDIMENTO:
- metodologie attive di business intelligence (modelli di apprendimento e tecniche di data mining);
- non richiedono al decision maker la formulazione di un’ipotesi preventiva da verificare, ma cercano di
estendere le sue conoscenze in modo induttivo.
MODELLI DI OTTIMIZZAZIONE:
- si pongono l’obiettivo di individuare la decisione migliore (sulla base di criteri dati) tra un insieme molto
ampio (spesso infinito) di soluzioni alternative
(un ambito tipico di applicazione è quello della ricerca operativa).
- In questo contesto ci si pone il problema di determinare quali valori di un dato insieme di variabili siano in
grado di massimizzare o minimizzare il valore di una variabile obiettivo, alla luce di determinati vincoli. Ci
si pone il problema di trovare una soluzione ottimale di fronte a certi vincoli.
- Lettura: Modelli di ottimizzazione, C. Vercellis (disponibile in BlackBoard) : non è stampabile, non è
oggetto d’esame.
I modelli di ottimizzazione si occupano di trovare la soluzione migliore in un insieme ampio
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali tendenzialmente infinito di possibili soluzioni. La soluzione migliore viene valutata in base all’obbiettivo
che vogliamo raggiungere tendendo conto dei vincoli. Possono essere utilizzati solo con strumenti
informatici.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 11. Problemi tipici della ricerca operativa
- Marketing (mix di prodotti): un'azienda produce televisori, impianti stereo e altoparlanti utilizzando una
scorta comune di componenti.
I componenti sono disponibili in quantità limitata (vincolo) e si deve determinare il mix di prodotti più
redditizio (problema) considerando che il profitto per unità fabbricata diminuisce con l'aumentare del
volume (vincolo) perché si rendono necessari degli ulteriori incentivi di prezzo per caricare il canale di
distribuzione.
- Trasporti: minimizzare i costi di spedizione della merce dagli stabilimenti ai magazzini nelle aree
metropolitane senza superare la capacità produttiva di ciascun stabilimento e soddisfacendo la domanda di
ciascuna area metropolitana.
- Gestione del personale (turnazione): i dipendenti prestano servizio 5 giorni consecutivi seguiti da due
giorni liberi. Determinare la turnazione che soddisfa la richiesta di presenze determinata dall'afflusso di
clienti e minimizza i costi di manodopera.
- Gestione finanziaria (tesoreria): determinare la modalità di investimento della liquidità in eccesso in
certificati di deposito a 1, 3 e 6 mesi, in modo da massimizzare il reddito da interessi e soddisfare la richiesta
di liquidità dell'azienda, includendo un margine di sicurezza.
DECISIONE:
- al vertice della piramide si colloca la fase di assunzione di una decisione;
- anche in presenza di un ambiente di business intelligence, tale attività resta di pertinenza del decision
maker che integra i suggerimenti e le conclusioni ricavate dai modelli con altre informazioni non strutturate
in suo possesso e con la sua personale esperienza.
Oggi ci sono sistemi di intelligenza artificiale che permettono di risolvere il problema dell’assunzione di una
decisione.
TECNICHE : algoritmi che utilizziamo per interpretare e rappresentare un fenomeno.
METODOLOGIE : processo utilizzato per sviluppare un’analisi di BI
Se ci riferiamo al processo analizziamo le attività da svolgere per completare un ciclo di BI.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 12. Ciclo di business intelligence
Le metodologie di analisi sono i processi di lavoro del decision maker. Il ciclo di BI è la sequenza logica di
attività che a partire dal dato portano all’estrazione e all’utilizzo della conoscenza, e alla verifica della bontà
delle decisioni assunte.
Analisi del problema (prima fase):
- formulazione accurata del problema;
- elaborazione di un modello mentale del fenomeno (se no elaboro una possibile strategia per andare a
costruire un modello mentale);
- selezione dei fattori (variabili) più rilevanti.
Questa prima fase del ciclo consente al decision maker di porre numerose domande e ottenere in modo
interattivo rapide risposte (informazioni).
Comprensione del fenomeno (seconda fase):
- le informazioni identificate durante la fase di analisi vengono trasformate in conoscenza sia tramite
intuizioni del decision maker (basate sulla sua esperienza e su eventuali informazioni non strutturate in suo
possesso), sia mediante l’applicazione di modelli di apprendimento induttivo.
Decisione (terza fase):
- le conoscenze ricavate attraverso la comprensione si traducono in decisioni e, successivamente, in azioni.
- La disponibilità di metodologie di business intelligence consente di sviluppare più rapidamente le fasi di
analisi e comprensione, arrivando a decisioni più efficaci (maggiore conoscenza) e tempestive (minori
tempi).
Misura degli esiti (quarta fase):
- Questa fase riguarda la misura, basata su metriche estese e metodologie analitiche, delle prestazioni a
seguito delle decisioni assunte e delle azioni conseguentemente intraprese.
La riduzione dei tempi di ciclo analisi – decisione – azione - revisione, la disponibilità di un maggior
numero di alternative e l’applicazione di metodologie analitiche per la misura delle prestazioni portano ad
un miglioramento complessivo (misurabile) della qualità del processo decisionale.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 13. Ciclo di business intelligence
Tra i fattori determinanti per il successo di un progetto di business intelligence vi sono:
- le tecnologie disponibili;
- le metodologie analitiche utilizzate;
- le risorse umane implicate.
TECNOLOGIE:
- incremento della potenza di calcolo dei microprocessori, che consente l’utilizzo di sofisticati algoritmi di
calcolo con costi e tempi contenuti;
- incremento della capacità di memorizzazione, che rende possibile l’immagazzinamento di grandi quantità
di dati a costi contenuti;
- facilità di interconnessione (accessibilità e ampiezza di banda) per la diffusione di informazioni e
conoscenza;
- facilità di integrazione delle piattaforme hardware e software, grazie alla diffusione di standard.
METODOLOGIE ANALITICHE:
- modelli matematici e metodologie analitiche svolgono un ruolo essenziale nella valorizzazione delle
informazioni e nell’estrazione di conoscenza dai dati;
- l’esplorazione dei dati, ancorché basata su tecniche evolute quali l’analisi multidimensionale e l’analisi
statistica classica (statistica descrittiva), appare insufficiente nei processi decisionali complessi, che
richiedono un supporto attivo quale quello fornito dai modelli di apprendimento induttivo e ottimizzazione.
RISORSE UMANE:
- nell’ambito dei processi decisionali, la capacità dei knowledge worker di assimilare informazioni e tradurle
in azioni concrete rappresenta uno dei principali patrimoni di ogni organizzazione e un fondamentale
elemento di vantaggio competitivo;
- anche in presenza di un sofisticato sistema di business intelligence, infatti, rimane ampio spazio per
valorizzare le doti personali dei knowledge worker, chiamati a interpretare i risultati delle analisi, a
immaginare soluzioni creative, a elaborare piani d’azione efficaci.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 14. Realizzazione del sistema di business intelligence
La realizzazione di un sistema di business intelligence si configura come una attività progettuale
caratterizzata da:
- un obiettivo finale;
- tempi e costi di sviluppo;
- l’utilizzo e il coordinamento di tutte le risorse (umane e strumentali) necessarie per svolgere le diverse
attività di progetto.
In relazione a tali caratteristiche, il ciclo di sviluppo del sistema appare del tutto analogo, nella sua struttura
generale, a quello di un qualsiasi sistema informatico complesso e consta delle seguenti fasi principali:
- giustificazione;
- pianificazione;
- progettazione;
- realizzazione e collaudo.
Per realizzare un BI seguiamo gli stessi passi per la creazione di un sistema informativo aziendale.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali
Fasi calate in un contesto di BI.
1. Giustificazione:
- valutazione (mediante interviste ai knowledge worker) delle esigenze dell’organizzazione in rapporto allo
sviluppo di un sistema di business intelligence;
- definizione degli obiettivi general
2. Pianificazione:
- pianificazione di massima dell’architettura per ciò che concerne gli sviluppi immediati e le possibili
evoluzioni nel medio periodo;
- implica le seguenti attività:
- ricognizione delle strutture informative esistenti;
- descrizione dei principali processi decisionali e dei relativi bisogni informativi;
- pianificazione (classica) di progetto, mediante metodologie di project management.
3. Progettazione:
- identificazione e descrizione delle funzionalità del sistema;
- ricognizione dei dati esistenti (reperibili da fonti interne e esterne) e progettazione delle strutture
informative (data warehouse / data mart);
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali - definizione dei modelli matematici da impiegare per le analisi e verifica di disponibilità dei dati necessari
ad alimentare i modelli;
- realizzazione di un prototipo del sistema.
4. Realizzazione e collaudo:
- sviluppo delle strutture dati (data warehouse e data mart) e dell’archivio dei metadati (significato dei dati e
trasformazioni applicate ai dati primari);
- sviluppo delle procedure ETL di estrazione e trasformazione dei dati presenti nelle fonti primarie e
caricamento nel data warehouse e nei data mart;
- realizzazione delle applicazioni di business intelligence;
- rilascio del sistema per il collaudo e l’utilizzo da parte dei knowledge worker.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 15. Metodologie di analisi tipiche di un sistema di BI
- Analisi e reporting
- Analisi multidimensionale
- Data mining
- Ottimizzazione
- Serie storiche
- Risk analysis
- Fraud detection
- Balanced scorecard (BSC)
- Ottimizzazione supply chain
- Cash management
- Revenue management
- Sales force planning
- Campaign management
- Market basket analysis
- Clickstream analysis
- Marketing relazionale
- Customer profiling
- … altre specifiche di settore
QUESTIONI ETICHE
Quando si ha a che fare con dati relativi agli individui nell’ambito del data mining, ci si imbatte in una serie
di questioni che vengono definite questioni etiche, che possono essere divisi in tre categorie:
- PRIVACY : principi etici orientati al rispetto della sfera personale degli individui. La privacy vincola certe
attività per quanto riguarda l’utilizzo di dati personali.
- RESPONSABILITÀ SOCIALE DELL’IMPRESA (CSR) : principi etici orientati ad evitare che un
aumento indiscriminato del potere economico e politico delle organizzazioni si traduca in un danno nei
confronti degli individui, nella loro molteplice veste di consumatori, lavoratori e cittadini.
- ETICA DEL COMPUTER (COMPUTER ETHICS) : principi etici orientati a guidare la condotta
(professionale e sociale) dei professionisti informatici.
PRIVACY
Le normative in vigore (*) intendono garantire che il trattamento dei dati personali si svolga nel rispetto dei
diritti e delle libertà fondamentali (tutelati, nel nostro Paese, dalla Costituzione della Repubblica), nonché
della dignità delle persone fisiche, con particolare riferimento alla riservatezza e all'identità personale. La
tutela si estende anche ai diritti delle persone giuridiche.
(*) nell’unione europea (Direttiva 95/46/EC, da cui deriva la normativa italiana - D.Lgs. 196/2003) e in
molti altri paesi del mondo (vedere mappa alla pagina che segue).
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali
In Italia la normativa definisce e regola, in particolare:
- gli obblighi relativi al trattamento;
- le informazioni d fornire agli interessati;
- L’acquisizione del consenso da parte dell’interessato;
- i diritti dell’interessato;
- le modalità di comunicazione e diffusione di dati personali;
- le restrizioni a cui sono soggetti i dati sensibili e giudiziari;
- le sanzioni previste;
- le misure minime di sicurezza da applicare nel caso di trattamenti effettuati con strumenti elettronici.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 16. Definizione di data warehousing
Non ci occupiamo solo delle modalità di presentazione dei dati (reporting) e modalità di analisi dei dati, ma
ci occupiamo anche della componente dati. Il successo di un sistema di BI, dipende dalla qualità dei dati che
sto analizzando. Se i dati sono di bassa qualità., rappresentano in modo inadeguato il fenomeno.
La componente dati p la componente più critica di un sistema di BI. Esiste un’ulteriore complessità legata al
fatto che, i data warehouse si prestano bene per l’attività di reporting e l’attività di analisi di tipo passivo,
dove il modello di rappresentazione del fenomeno sta nella mente del decision maker.
INTRODUZIONE
Sinonimo di database fisico (generalmente relazionale) che funge da deposito dei dati (anche indicato in
letteratura con i termini DW – Data Warehouse, BDW – Business Data Warehouse, BIW – Business
Information Warehouse).
“Il data warehouse è una collezione di dati finalizzata, integrata, soggetta alla variazione del tempo e non
volatile, per il supporto del processo decisionale”. W. H. Inmon (1996).
FINALIZZATA : si intende tutto il concetto di progettazione del DW, significa orientata a un certo
obiettivo, che è l’analisi del dato, quindi finalizzata indica la progettazione, ossia la costruzione di un
modello logico di rappresentazione dei dati.
INTEGRATA : quando costruiamo un DW ci poniamo il problema di integrare diverse fonti di dati
(primarie e secondarie). Il DW integra dati provenienti da diverse fonti.
SOGGETTA ALLA VARIAZIONE DEL TEMPO : soprattutto per i modelli di data mining, è necessario
avere lunghe serie storiche per cercare di identificare delle regolarità nei dati. Lunghe serie storiche significa
che la base dati deve dar conto della variazione temporale del dato, ma accumulare il dato lungo periodi
temporali ampi. Questo significa accumulare nel tempo dati.
NON VOLATILE : tutti i dati presenti in un DW tendenzialmente non vengono mai cancellati.
Il DW per com’è costruito è un modello che si presta senza altri interventi di trasformazioni ad attività di
reporting e di analisi di tipo multidimensionale.
Ambiente con strutture dati finalizzate a supporto decisionale e analisi di business intelligence (OLAP – On
Line Analytical Processing), fisicamente separato dai sistemi operazionali.
Con il termine data warehousing viene normalmente indicato il complesso di attività riguardanti la
progettazione, la realizzazione e l’utilizzo di un data warehouse (processo).
Data warehouse è l’oggetto fisico, il deposito, data warehousing è il processo, l’insieme delle attività di
realizzazione e di utilizzo di un data warehouse.
TIPOLOGIE DI DATI
DATI INTERNI (FONTI PRIMARIE)
Conservati in prevalenza nei database che costituiscono il sistema informativo di un’azienda, normalmente
indicati come sistemi operazionali o anche sistemi transazionali (OLTP – On Line Transaction Processing).
Riguardano le principali entità (es. fatture, ordini, prodotti, clienti, fornitori) che intervengono nei processi
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali aziendali (es. amministrazione, contabilità, produzione, logistica) e vengono raccolti attraverso i programmi
applicativi gestionali (normalmente indicati come ERP - Enterprise Resource Planning).
DATI ESTERNI (FONTI SECONDARIE)
Esistono numerose fonti di dati esterne che estendono le informazioni presenti nei database interni:
- scenari economici e finanziari;
- dati di mercato;
- dati sociodemografici;
- opinioni di consumatori;
- …
DATI PERSONALI (FONTI SECONDARIE)
I decision maker che sviluppano analisi di business intelligence dispongono di dati personali (informazioni,
valutazioni) conservati all’interno di fogli di calcolo o database locali.
Il recupero di tali informazioni e la loro integrazione con dati strutturati di origine interna ed esterna,
fondamentale ai fini del processo decisionale, rappresentano uno degli obiettivi del knowledge management
(anche indicato in letteratura come KM).
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 17. Definizione di sistemi OLTP E OLAP
STRUTTURA (FOCUS SUL REPORTING)
I sistemi OLTP non sono adeguatamente predisposti per rispondere a tutte le domande che potrei fare in un
sistema analitico. Inoltre c’è una scarsa profondità storica del dato.
PERCHÉ SEPARARE GLI AMBITI
In un sistema operazionale si inserisce il dato, nell’ambito di un sistema analitico il focus è sull’estrazione
del dato che verrà poi interpretato.
Integrazione
I sistemi di supporto alle decisioni devono accedere a informazioni provenienti da fonti diverse, spesso
eterogenee.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali Un data warehouse che integri le diverse fonti rappresenta uno strumento fondamentale per agevolare
l’accesso alle informazioni.
L’integrazione può essere perseguita uniformando la codifica dei dati, le unità di misura utilizzate e
perseguendo l’omogeneità semantica (significato) delle informazioni.
Qualità
I dati trasferiti dai sistemi operazionali ai data warehouse vengono esaminati e corretti al fine di ottenere
informazioni attendibili e depurate da errori (per quanto non sia possibile ridurre a zero il tasso di errore).
Ciò aumenta la significatività e, di conseguenza, il valore (decisionale) delle analisi di business intelligence
realizzate a partire da tali dati.
Nel passaggio dalle fonti dei dati al DW non trascuriamo l’attività di trasposizione dei dati, ma teniamo
conto anche della necessità di controllare la qualità del dato. I dati devono avere un’adeguata qualità, perché
la bontà delle decisioni dipende dalla qualità dei dati.
Efficienza
Le interrogazioni proprie delle analisi di business intelligence possono essere molto onerose in termini di
potenza di calcolo assorbita e tempo necessario per la loro elaborazione. Devono essere fatte tantissime
transazioni semplici nei tempi minori possibili. Nell’ambito del BI non ho questo problema.
Se fossero realizzate direttamente sui sistemi operazionali, rischierebbero di compromettere l’efficienza di
funzionamento degli applicativi gestionali, con conseguenze anche molto negative sull’operatività aziendale.
Estensione
I dati presenti nei sistemi operazionali hanno una limitata estensione temporale. Per motivi di efficienza,
infatti, le informazioni storiche vengono periodicamente rimosse da tali sistemi e archiviate.
Al contrario, le analisi di business intelligence e, in particolare, i modelli predittivi hanno la necessità di
accedere a lunghe serie storiche di dati per poter cogliere le tendenze e regolarità che in essi si manifestano.
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali 18. Definizione di data wareahouse
Un data warehouse è una collezione di dati a supporto dei processi decisionali e delle analisi di business
intelligence, dotata delle seguenti caratteristiche:
- ORIENTATA ALLE ENTITÀ : i dati presenti in un data warehouse sono incentrati sulle principali entità
di interesse per l’analisi. All’interno di un DW non ci sono tutte le entità di interesse dell’impresa, ma solo
quelle di interesse per le mie attività analitiche.
- INTEGRATA : i dati provenienti da diverse fonti sono integrati e omogeneizzati attraverso il loro
inserimento in un data warehouse.
- TEMPIFICATA : i dati inseriti in un data warehouse si accompagnano a un’etichetta temporale che ne
identifica il periodo di riferimento.
- PERSISTENTE (O NON VOLATILE) : una volta inseriti in un data warehouse, i dati non vengono di
norma modificati né cancellati.
- CONSOLIDATA : di norma, alcuni dati presenti nei data warehouse sono ottenuti come somme parziali di
dati elementari presenti nei sistemi operazionali di origine.
- DENORMALIZZATA : a differenza di quanto avviene nei database operazionali, i dati presenti in un data
warehouse non sono (sempre) posti in forma normale. Per esigenze analitiche quando si passa dalla fonte
originaria del dato al DW si applica una de normalizzazione, per evitare le ridondanze.
Sintesi delle differenze tra OLTP E OLAP
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali
DATA MART (DM)
E’ un DW costruito per estrazione che contiene dati di interesse per un specifico settore aziendale.
Sistema che raccoglie tutti i dati riferiti ad una specifica funzione aziendale (dominio applicativo), finalizzati
al supporto decisionale e alle analisi di business intelligence.
E’ possibile considerare un data mart come un data warehouse funzionale o dipartimentale, di dimensioni
più contenute e di natura più specifica rispetto al data warehouse aziendale (tecnicamente, è un sottoinsieme
logico o fisico di un data warehouse).
Data warehouse e data mart sono riconducibili ad una medesima matrice tecnologica (tipicamente basata su
RDBMS).
PROBLEMATICA DI QUALITÀ DEI DATI
Per la sua finalità di supporto ai processi decisionali, il data warehouse deve essere caratterizzato da una
elevata qualità dei dati.
Il problema di verificare, preservare e incrementare la qualità dei dati rappresenta una preoccupazione
costante per i responsabili della progettazione e della gestione di un data warehouse (emergere delle figure
professionali di data warehouse architect e data warehouse administrator).
Principali inconvenienti che possono compromettere la validità e l’integrità delle informazioni:
Principali fattori che influenzano la qualità dei dati:
- ACCURATEZZA : corretta rappresentazione dei dati e intervalli di variazione dei valori (domini) coerenti.
- COMPLETEZZA : i valori mancanti devono essere in numero relativamente limitato.
- CONSISTENZA : i dati devono essere coerenti, in forma e contenuto, rispetto alle fonti di provenienza.
- ATTUALITÀ : i dati devono essere aggiornati in relazione agli obiettivi delle analisi.
- NON RIDONDANZA : i dati devono essere non ridondanti, salvo eccezioni (denormalizzazione)
Valentina Minerva Sezione Appunti
Laboratorio informatico per le decisioni aziendali