Definizione e caratteristiche di analisi multidimensionale
Rientra nelle analisi di tipo passivo. dà maggiore efficienza nell’analisi dei dati, ma non aggiunge intelligenza, perché il modello sta nella struttura logica con cui ho costruito il data warehouse. Lo shema logico sottostante al DW è un’analisi multidimensionale.
CARATTERISTICHE
Estrazione di conoscenza dai dati sulla base di un approccio passivo, attraverso criteri di analisi suggeriti dal decision maker (criteri propri con cui è costruito il warehouse).
Alla stessa categoria appartengono i metodi di analisi statistica tradizionale e i sistemi di interrogazione e reporting (di cui l’analisi multidimensionale fa parte).
RAPPRESENTAZIONE MULTIDIMENSIONALE
I knowledge worker abitualmente ragionano in termini multidimensionali (es. vendite per quadrimestre per venditore o per punto vendita, costi per linea di produzione per stabilimento).
I fenomeni o fatti o eventi che devono esaminare (es. andamento delle vendite) sono infatti correlati con molte variabili o dimensioni (es. clienti, venditori, prodotti, regioni).
La multidimensionalità dei dati è un concetto logico (schema o modello di rappresentazione) e non fisico.
Il modello multidimensionale si basa sulle tabelle dei fatti e sulle tabelle delle dimensioni. Per fatto si intende un fenomeno di interesse per l’organizzazione, viene rappresentato attraverso una misura. Gli altri elementi che stanno nella tabella dei fatti sono i puntatori alla tabella dimensioni.
Es. rappresentazioni tabellare e multidimensionale delle vendite per anno, prodotto e zona.
In questo esempio passiamo da un semplice report in forma tabellare a un report multidimensionale.
Non stiamo sviluppando conoscenza, ma stiamo trovando un modo efficiente per estrarre informazioni da un DW e darne una rappresentazione grafica, visiva, quindi stiamo ancora facendo reporting.
Un sistema di analisi multidimensionale attraverso modelli SQL consente di costruire report dinamici, senza aggiungere intelligenza ma solo efficienza.
La progettazione di data warehouse e data mart si basa su un paradigma di rappresentazione multidimensionale dei dati, in grado di garantire un duplice vantaggio:
- sul piano logico, le dimensioni corrispondono in modo naturale ai criteri di analisi utilizzati dai knowledge worker;
- sul piano funzionale, riesce a garantire tempi di risposta (relativamente) rapidi a fronte di interrogazioni anche molto complesse.
La rappresentazione multidimensionale si basa su schemi a stella (star schema e relative varianti) contenenti due tipi di tabelle:
- TABELLE DELLE DIMENSIONI : le dimensioni corrispondono alle entità intorno alle quali si articolano i processi di un’organizzazione (es. clienti, venditori, prodotti, regioni, tempo).
Le tabelle delle dimensioni contengono le informazioni relative alle entità primarie presenti nel data warehouse e si riferiscono, in molti casi, alle master table dei sistemi operazionali.
Ogni tabella delle dimensioni risulta spesso strutturata al proprio interno secondo relazioni gerarchiche (es. i prodotti possono appartenere a strutture gerarchiche del tipo reparto, genere, articolo).
- TABELLE DEI FATTI (O DEGLI EVENTI) : le tabelle dei fatti si riferiscono in genere a transazioni e contengono due tipi di dati:
- collegamenti alle tabelle delle dimensioni;
- valori numerici (misure) degli attributi che caratterizzano le corrispondenti transazioni e che costituiscono l’effettivo oggetto delle successive analisi di tipo multidimensionale.
Ad esempio, una tabella dei fatti può contenere le transazioni di vendita (il fenomeno o evento da analizzare) e fare riferimento a diverse tabelle delle dimensioni: clienti, venditori, prodotti, regioni, tempo.
Le corrispondenti misure di interesse sono costituite da attributi quali quantità, prezzo, sconto.
Questa tabella dei fatti consente ai knowledge worker di analizzare l’andamento delle vendite lungo le diverse prospettive
(dimensioni) e relative gerarchie.
I processi aziendali riguardano fatti. Di ogni fatto interessano i valori di alcuni proprietà che nel modello multidimensionale chiamiamo misure. sono le proprietà che caratterizzano i fatti. I valori vengono interpretati in relazione ad alcune proprietà che sono dette dimensioni. Le informazioni lungo le dimensioni spesso sono raggruppate in forma gerarchica. Le gerarchie consentono di fare delle operazioni di espansione e compressione delle dimensioni, andare da una visualizzazione generale, ad una visualizzazione a maggior livello di dettaglio.
Continua a leggere:
- Successivo: Il modello multidimensionale in sintesi
- Precedente: Accesso al data warehouse – operazioni di front-end
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.