Gerarchie di concetti e operazioni OLAP
Le analisi OLAP impiegano gerarchie di concetti per consolidare i dati e creare viste logiche lungo le dimensioni di un data warehouse.
Una gerarchia di concetti definisce un insieme di corrispondenze “a cascata” tra concetti di livello superiore e concetti di livello inferiore (es. nazione -->regione --> provincia --> località oppure reparto --> famiglia--> prodotto oppure anno --> trimestre --> mese --> settimana --> giorno).
Gerarchia di concetti esemplificativa (punti vendita):
L’unico razionale che c’è per costruire una gerarchi è ragionare in termini: nazione, regione, provincia, città.
In una società la ragione sociale è l’ultimo elemento. Il cliente persona fisica o il punto vendita può stare all’interno di un comune, che sta all’interno di una provincia, ecc.
Gerarchia di concetti esemplificativa (impiegati):
Le gerarchie di concetti vengono impiegate per svolgere diverse operazioni di visualizzazione rispetto a cubi di dati presenti in un data warehouse.
- ROLL-UP (DRILL-UP) – COMPRESSIONE/AGGREGAZIONE : corrisponde a un’aggregazione nel cubo di dati ottenuta mediante (SQL: query di selezione con raggruppamento):
- il passaggio ad un livello superiore lungo una gerarchia definita su una dimensione (es. il passaggio da località a provincia conduce a consolidare le misure di interesse su tutti i record per i quali la località appartiene a una stessa provincia);
- la riduzione di una dimensione (es. la rimozione della dimensione tempo conduce a consolidare le misure di interesse su tutti i periodi temporali presenti nel cubo di dati).
- DRILL-DOWN (ROLL-DOWN) – ESPANSIONE/DISAGGREGAZIONE : consente di navigare attraverso un cubo di dati da informazioni aggregate e consolidate a informazioni con un maggiore grado di dettaglio (SQL: query di selezione senza raggruppamento).
Si può effettuare mediante:
- il passaggio ad un livello inferiore lungo una gerarchia definita su una dimensione (es. il passaggio da provincia a località conduce a disaggregare le misure di interesse su tutti i record per i quali la località appartiene a una stessa provincia);
- l’aggiunta di una dimensione (es. l’introduzione della dimensione tempo conduce a disaggregare le misure di interesse su tutti i periodi temporali presenti nel cubo di dati).
Esempio:
- SLICE AND DICE (slice = affettare, implica il fatto di fissare un valore) : l’operazione di slice seleziona (fissa) il valore di un attributo lungo una delle dimensioni (SQL: query di selezione con vincolo di uguaglianza). L’operazione di dice consente di derivare un cubo in un sottospazio ottenuto selezionando più di una dimensione simultaneamente (fissando, o limitando ad un intervallo, il valore degli attributi) (SQL: query di selezione con più vincoli di uguaglianza o di range tra loro combinati). Questa operazione porta ad avere un solo grado di libertà.
Il dice ritaglia all’interno dell’ipercubo un cubo più piccolo che assume solo due dimensioni.
- PIVOT : l’operazione di pivot o rotazione permette di ruotare gli assi scambiando tra loro alcune dimensioni per ottenere una diversa vista sul cubo di dati (SQL: cambio di argomento nella query di selezione).
I cubi OLAP sono la materializzazione del concetto di multidimensionalità- per operazioni OLAP si intendono tutte le operazioni che si possono fare sul cubo.
Continua a leggere:
- Successivo: Fondamenti di data mining: definizione
- Precedente: Contenuto informativo di un ipercubo
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.