Definizione di data warehousing
Non ci occupiamo solo delle modalità di presentazione dei dati (reporting) e modalità di analisi dei dati, ma ci occupiamo anche della componente dati. Il successo di un sistema di BI, dipende dalla qualità dei dati che sto analizzando. Se i dati sono di bassa qualità., rappresentano in modo inadeguato il fenomeno.
La componente dati p la componente più critica di un sistema di BI. Esiste un’ulteriore complessità legata al fatto che, i data warehouse si prestano bene per l’attività di reporting e l’attività di analisi di tipo passivo, dove il modello di rappresentazione del fenomeno sta nella mente del decision maker.
INTRODUZIONE
Sinonimo di database fisico (generalmente relazionale) che funge da deposito dei dati (anche indicato in letteratura con i termini DW – Data Warehouse, BDW – Business Data Warehouse, BIW – Business Information Warehouse).
“Il data warehouse è una collezione di dati finalizzata, integrata, soggetta alla variazione del tempo e non volatile, per il supporto del processo decisionale”. W. H. Inmon (1996).
FINALIZZATA : si intende tutto il concetto di progettazione del DW, significa orientata a un certo obiettivo, che è l’analisi del dato, quindi finalizzata indica la progettazione, ossia la costruzione di un modello logico di rappresentazione dei dati.
INTEGRATA : quando costruiamo un DW ci poniamo il problema di integrare diverse fonti di dati (primarie e secondarie). Il DW integra dati provenienti da diverse fonti.
SOGGETTA ALLA VARIAZIONE DEL TEMPO : soprattutto per i modelli di data mining, è necessario avere lunghe serie storiche per cercare di identificare delle regolarità nei dati. Lunghe serie storiche significa che la base dati deve dar conto della variazione temporale del dato, ma accumulare il dato lungo periodi temporali ampi. Questo significa accumulare nel tempo dati.
NON VOLATILE : tutti i dati presenti in un DW tendenzialmente non vengono mai cancellati.
Il DW per com’è costruito è un modello che si presta senza altri interventi di trasformazioni ad attività di reporting e di analisi di tipo multidimensionale.
Ambiente con strutture dati finalizzate a supporto decisionale e analisi di business intelligence (OLAP – On Line Analytical Processing), fisicamente separato dai sistemi operazionali.
Con il termine data warehousing viene normalmente indicato il complesso di attività riguardanti la progettazione, la realizzazione e l’utilizzo di un data warehouse (processo).
Data warehouse è l’oggetto fisico, il deposito, data warehousing è il processo, l’insieme delle attività di realizzazione e di utilizzo di un data warehouse.
TIPOLOGIE DI DATI
DATI INTERNI (FONTI PRIMARIE)
Conservati in prevalenza nei database che costituiscono il sistema informativo di un’azienda, normalmente indicati come sistemi operazionali o anche sistemi transazionali (OLTP – On Line Transaction Processing).
Riguardano le principali entità (es. fatture, ordini, prodotti, clienti, fornitori) che intervengono nei processi aziendali (es. amministrazione, contabilità, produzione, logistica) e vengono raccolti attraverso i programmi applicativi gestionali (normalmente indicati come ERP - Enterprise Resource Planning).
DATI ESTERNI (FONTI SECONDARIE)
Esistono numerose fonti di dati esterne che estendono le informazioni presenti nei database interni:
- scenari economici e finanziari;
- dati di mercato;
- dati sociodemografici;
- opinioni di consumatori;
- …
DATI PERSONALI (FONTI SECONDARIE)
I decision maker che sviluppano analisi di business intelligence dispongono di dati personali (informazioni, valutazioni) conservati all’interno di fogli di calcolo o database locali.
Il recupero di tali informazioni e la loro integrazione con dati strutturati di origine interna ed esterna, fondamentale ai fini del processo decisionale, rappresentano uno degli obiettivi del knowledge management (anche indicato in letteratura come KM).
Continua a leggere:
- Successivo: Definizione di sistemi OLTP E OLAP
- Precedente: Metodologie di analisi tipiche di un sistema di BI
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.