Punti fondamentali dell'attività di data mining
Il data mining è un’attività di esplorazione e analisi dei dati per individuare, mediante un processo di apprendimento (che è un processo attivo) eventuali regolarità ed estrarre informazioni.
Le regolarità sono rappresentabili sotto forma di modelli, nella forma più svariata. Estrarre informazioni con l’obiettivo di generalizzare tutto ciò che si riferisce a un campione limitato di osservazioni. Si chiamano tecniche induttive o inferenziali perché estendiamo la verità scoperta all’interno di un campione, all’intera popolazione (generalizzazioni).
Informazioni e conoscenza utili nei processi decisionali sotto due aspetti: un aspetto di tipo interpretativo e un aspetto di tipo previsionale.
Le modalità di apprendimento possono essere di tipo supervisionato o non supervisionato. Supervisionato quando esiste la possibilità che un’entità che funge da supervisore verifichi le risultanze del modello di apprendimento e dica quando si è classificato bene. Non supervisionato quando nel data set tutti gli attributi sono equivalenti, a nessuno di loro può essere attribuito il significato di attributo target. In questo caso nessuno dice se il modello di classificazione è corretto.
Continua a leggere:
- Successivo: Tecniche di data mining – parte avanzata
- Precedente: Regole associative - market basket analysis
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.