Introduzione all'esplorazione dei dati oggetto di un'analisi di business
L’analisi esplorativa ha lo scopo di evidenziare, mediante l’applicazione di metodi grafici e il calcolo di indicatori statistici sintetici(*), le principali caratteristiche di ciascun attributo presente in un dataset e di individuare l’intensità della relazione che lega gli attributi tra loro.
(*) Qui solo richiamati, per maggiori dettagli si rimanda ai corsi di statistica di base (statistica descrittiva) e/o al modulo di statistica del presente corso.
È il presupposto fondamentale che consente di fare tutte quelle operazioni dei dati per migliorare la qualità e semplificare il data set.
Il processo di analisi esplorativa di un dataset si compone normalmente di tre fasi:
- ANALISI UNIVARIATA, che studia le proprietà di ogni singolo attributo del dataset;
- ANALISI BIVARIATA, che prende in considerazioni coppie di attributi e misura l’intensità del legame che intercorre tra essi;
- ANALISI MULTIVARIATA, rivolta allo studio dei legami che sussistono tra un sottoinsieme di attributi.
Consentono di studiare le proprietà di singoli attributi, o di coppie o gruppi di attributi. Se ho due attributi all’interno di una data set i cui valori variano in modo correlato, posso supporre che uno dei due attributi possa essere eliminato.
Continua a leggere:
- Successivo: Utilità dell’approccio esplorativo: l'analisi univariata
- Precedente: Logiche di riduzione dei dati all'ingresso
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.