Definizione di clusterizzazione non supervisionata
Non esiste una variabile dipendente che guida il processo di apprendimento. Il programma di apprendimento costruisce una struttura di conoscenze utilizzando alcune misure della qualità dei cluster per raggruppare i casi in due o più classi.
Obiettivo primario di una strategia di clusterizzazione non supervisionata è quello di scoprire le strutture concettuali dei dati.
Abbiamo gia visto esempi classici di tale strategia non supervisionata. Vediamo adesso due altre applicazioni.
- VALUTAZIONE APPRENDIMENTO SUPERVISIONATO : un modello di apprendimento supervisionato ha suddiviso il training set in un certo numero di classi. Utilizzare la clusterizzazione non supervisionata per valutare se i casi di ogni classe possono essere raggruppati insieme. Se così non è, possiamo concludere che gli attributi utilizzati nel modello supervisionato non discriminano adeguatamente i casi.
- IDENTIFICAZIONE DEGLI OUTLIER : con un ragionamento analogo al precedente, la clusterizzazione non supervisionata può aiutare ad individuare alcuni casi anomali presenti nei dati (casi non classificabili all’interno di una classe), i cosiddetti outlier.
Gli outlier, normalmente esclusi dalle applicazioni statistiche di data mining, possono rivestire grande importanza.
Ad esempio, un’applicazione che analizza gli acquisti effettuati con carta di credito potrebbe identificare come outlier un caso di probabile uso fraudolento della carta.
Continua a leggere:
- Successivo: Regole associative - market basket analysis
- Precedente: Tecniche di data mining – previsione
Per approfondire questo argomento, consulta le Tesi:
- Un analisi statistica su come le recensioni possono influenzare la scelta di acquisto dei consumatori
- Sistemi web-based di analisi strategica: Business Intelligence e Big Data
- Il Data mining a supporto dei processi decisionali in azienda
- L'evoluzione dei sistemi informativi e di controllo aziendali
- Analisi dei processi di CRM nel web: electronic customer relationship management
Puoi scaricare gratuitamente questo appunto in versione integrale.