Qualità dei dati in ingresso: dati inconsistenti
I dati presentano talvolta discrepanze nella codifica di rappresentazione e risultano quindi inconsistenti. L’inconsistenza del dato è determinata da un cambiamento nelle modalità di rappresentazione.
Ad esempio, la codifica dei prodotti realizzati da un’azienda può aver subito una revisione a partire da una certa data, senza che i dati registrati in periodi precedenti siano stati oggetto di trasformazione.
E’ evidente che per ovviare a questo problema il dataset dovrà essere opportunamente trattato prima di essere utilizzato per le analisi di data mining.
Devo andare a capire cosa è avvenuto all’interno dei sistemi primari e procedere a una ricodifica.
Continua a leggere:
- Successivo: Trasformazione dei dati in ingresso
- Precedente: Qualità dei dati in ingresso: dati soggetti a rumore
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.