Definizione di cubi OLAP
Una tabella dei fatti collegata a n tabelle delle dimensioni (star schema) può essere rappresentata mediante un cubo di dati n-dimensionale (ipercubo) nel quale ciascuno degli assi (lati) corrisponde a una delle dimensioni, e al suo interno il cubo è costituito con i valori della metrica scelti.
Contenuto informativo di un (ipercubo):
Stiamo rappresentando il fatto vendita, utilizzando come metrica la quantità e il numero di prodotti venduti. Le dimensioni sulle quali sviluppiamo l’analisi sono la dimensione prodotto, una dimensione geografica (nazione) e una dimensione temporale). Ad esempio il dato 165 rappresenta il numero di registratori venduti nel 1° trimestre negli Stati Uniti.
Inoltre posso aggregare, per vedere le quantità di tutti i prodotti venduti negli Stati Uniti = 1691. In questo caso sto facendo un’operazione di compressione.
Se schiacciassi il cubo per l’asse dei tempi potrei avere la somma dei video registratori venduti nell’anno negli Stati Uniti.
Se gli USA in realtà non fossero il massimo contenuto informativo, ma avessi previsto una gerarchia che prevede Nazione e Stato potrei passare dalla visualizzazione del venduto negli USA, alla visualizzazione del venduto in ognuno degli stati che costituiscono gli USA.
Gli strumenti OLAP consentono di costruire il cubo a partire dal warehouse e fare queste operazioni di aggregazione e disaggregazione.
I cubi rappresentano una naturale estensione dei fogli elettronici, che possono essere considerati, a tutti gli effetti, dei cubi bidimensionali.
Se nell’esempio precedente pensassimo di prefissare la dimensione nazione (ad esempio, ponendola uguale a USA), otterremmo la tabella (cubo bidimensionale) che segue.
In realtà, per ogni valore della dimensione nazione otteniamo una tabella (quindi, tante tabelle quanti sono i valori assunti dalla dimensione nazione).
Questa è la visualizzazione se fissassi il valore della Nazione a USA. In questo modo leggo solo una faccia del cubo.
Questo esempio indica il modo con il quale è possibile rappresentare dei cubi multidimensionali (nelle esercitazioni ci limiteremo a tre dimensioni) in due dimensioni, mediante l’uso di fogli elettronici.
Ampliando il concetto fin qui sviluppato, all’interno di un cubo tridimensionale è possibile ricavare tre viste logiche, costituite da cubi bidimensionali (denominati
cuboidi), fissando di volta in volta il valore di una delle dimensioni: vista 1 (tempo, prodotto; nazione = fissata), vista 2 (tempo, nazione; prodotto = fissato), vista 3 (nazione, prodotto; tempo = fissato).
In realtà, ogni cuboide bidimensionale (cuboide 2D) genera tante tabelle bidimensionali quanti sono i valori assunti dalla dimensione fissata.
Analogamente, fissando di volta in volta il valore di due dimensioni, è possibile ottenere altre tre viste logiche, costituite da singole colonne di tabella (cubi
monodimensionali).
Anche in questo caso, ogni cuboide monodimensionale (cuboide 1D) genera tante
colonne (tabelle monodimensionali) quante sono le combinazioni tra i singoli valori assunti dalle due dimensioni fissate.
Più in generale, a partire da una tabella dei fatti collegata a n tabelle delle dimensioni, è possibile realizzare un reticolo di cuboidi (più precisamente, 2n cuboidi), ciascuno dei quali corrisponde a un diverso grado di consolidamento lungo una o più dimensioni.
In realtà, la presenza di gerarchie lungo le dimensioni rende ancora più elevato il numero di cuboidi , che è possibile calcolare come
La teoria dice che un cubo è costruito da una rete di cuboidi che si ottiene fissando il valore di una o più dimensioni. Se fisso il valore di tutte le dimensioni ottengo il massimo livello di aggregazione.
Rete di cuboidi nel caso tridimensionale con dimensioni mese, regione, articolo (no gerarchie).
Il cuboide “base” corrisponde alle celle interne del cubo (minima aggregazione), quello “apice” contiene una sola cella (massima aggregazione).
Ogni cuboide è una famiglia di sottocubi.
Continua a leggere:
- Successivo: Contenuto informativo di un ipercubo
- Precedente: Definizione di analisi multidimensionale OLAP
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.