Definizione di strumenti ETL
Gli strumenti ETL svolgono in modo automatico (o parzialmente automatico) le funzioni di estrazione (Extract), trasformazione (Transform) e caricamento (Load) dei dati nel data warehouse. Gli ETl sono un insieme di programmi semi automatizzati (perché raramente il processo di estrazione avviene in modo automatico) che consentono di individuare i dati da estrarre, permettono di estrarli, trasformali e caricarli.
- ESTRAZIONE : i dati vengono estratti dalle fonti interne e esterne sulla base di un approccio che prevede una fase iniziale nella quale il data warehouse “vuoto” viene alimentato con i dati disponibili riferiti a periodi passati e fasi successive caratterizzate da estrazioni di natura incrementale.
- TRASFORMAZIONE : è costituita da due fasi. Nella fase di pulitura, ci si propone di migliorare la qualità dei dati estratti dalle diverse fonti mediante la correzione di inconsistenze, inesattezze, carenze. Nella fase di trasformazione si procede ad ulteriori conversioni dei dati (che ne garantiscano l’omogeneità rispetto all’integrazione delle diverse fonti) e aggregazioni (per ottenere le sintesi necessarie a svolgere le analisi).
- CARICAMENTO : i dati opportunamente estratti e trasformati vengono infine inseriti nelle strutture informative (tabelle) predisposte.
Continua a leggere:
- Successivo: Definizione di deposito di metadati
- Precedente: Definizione di data wareahouse
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.