Skip to content

Classificazione automatica per dati ad alta dimensionalità: un approccio fuzzy per dati categorici

I tradizionali algoritmi di cluster analysis, che suddividono un insieme di osservazioni in gruppi omogenei (cioè con le stesse caratteristiche), si sono da sempre focalizzati su dati quantitativi, sfruttandone le relative proprietà geometriche e statistiche per calcolare la diversità tra i punti che devono essere "clusterizzati". Tale approccio, basato fondamentalmente sul concetto di distanza, però, non è risultato essere di aiuto dal momento che la maggior parte dei dataset in circolazione ha iniziato a contenere variabili assumenti valori non numerici, ossia di tipo qualitativo (o categorico). Lavorare con tale tipo di variabili non è per nulla semplice, siccome le loro proprietà geometriche e statistiche non hanno le stesse funzionalità rispetto alle variabili quantitative.
Sebbene per un periodo ci sia stato un parziale disinteresse verso i dati categorici, da qualche decennio a questa parte molti studi scientifici hanno iniziato a focalizzarsi sul loro utilizzo nelle più complesse tecniche di analisi statistica, tra cui anche gli algoritmi di cluster analysis. A tal proposito, primo obiettivo del presente lavoro - che si inserisce all'interno di un vasto filone di indagine - è quello di illustrare le problematiche connesse al raggruppamento di tali dati, proponendo specifiche soluzioni.
Se al problema di cui sopra si aggiunge, poi, la considerazione che nella maggior parte dei casi è difficile raggruppare determinate osservazioni in gruppi ben distinti (nel senso che esiste la possibilità che ciascuna di loro possa appartenere ad uno o più gruppi, sintetizzabile nella fuzzy cluster analysis), la faccenda diventa abbastanza complicata.
Secondo obiettivo del presente lavoro è, dunque, quello di adattare la cluster analysis per dati categorici al caso in cui l'assegnazione delle osservazioni ad uno ed un solo gruppo non rispecchia fedelmente la struttura dei dati: le osservazioni, cioè, presentano delle caratteristiche intermedie rispetto a quelle di due (o più) gruppi. Quanto detto porterà alla costruzione ed alla successiva validazione di un particolare algoritmo, in grado di rivelare informazioni utili presenti nei dati di partenza, sia in termini di interrelazioni tra le variabili categoriche, sia in termini di struttura di gruppo.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista
Mostra/Nascondi contenuto.
Capitolo 1 Elementi di Cluster Analysis L’idea di dividere cose simili in categorie, ovvero di raggrupparle per produrre una classificazione, è da sempre una delle "attività" più basilari di ogni essere umano. [22] Trattare qualsiasi cosa come se appartenente ad un’unica grande entità, e magari non differenziarla da un insieme di altre cose, potrebbe risultare sbagliato, soprattutto per- chè non è detto che tutto ciò di cui si è circondati sia caratterizzato sempre dalle stesse proprietà: esiste, cioè, una certa componente di diversità a cui fare riferimento, che consente di non «fare di tutta l’erba un fascio». Inserendo tale problema in ambito statistico, una delle tecniche più utilizzate dagli stu- diosi dei dati che cerca di "smascherare" tale diversità è la cluster analysis (o cluste- ring), valida per riconoscere ed organizzare, appunto, differenti tipi di eventi, oggetti, persone, animali e tanto altro ancora. In questo primo capitolo, si presentano in ma- niera semplice le caratteristiche e gli obiettivi della cluster analysis, evidenziandone alcuni concetti importanti: quello di partizione, quello di cluster (classe, gruppo) e, con le dovute differenze, quello di diversità. Per renderne semplice la comprensione, si ritiene utile partire da due esempi. 1.1 Introduzione Si pensi ad un’azienda che vive in un mercato caratterizzato da forte concorrenza. Per attuare strategie di marketing vincenti, essa deve ricercare una serie di vantaggi competitivi, tra cui le informazioni relative al target a cui punta, decisivi per conosce- re i desideri/bisogni/problemi dei clienti e soddisfarli, così, in modo più efficace ed efficiente. Per questo motivo le ricerche di mercato sulla clientela sono importanti; riescono, infatti, a valutare le caratteristiche ed i comportamenti dei clienti, persona- lizzando l’offerta, in un’ottica di fidelizzazione ed aumento delle quantità dei prodotti venduti. I clienti, infatti, non sono tutti uguali, ma presentano preferenze, aspettati- ve, e comportamenti diversi. Lo strumento attraverso il quale l’azienda tiene conto di tutti questi aspetti psicologici, emotivi, comportamentali ecc., e raggruppa, appunto, i clienti attraverso le variabili che li rendono simili, prende il nome di segmentazione. A titolo di secondo esempio, si pensi ora ad un laboratorio di analisi che sta pensando di studiare la situazione clinica di un insieme di pazienti diabetici. Quest’ultima varia da paziente a paziente, visto che sono molteplici i segni ed i sintomi con i quali il dia- bete si presenta agli occhi dei medici, e non è detto che tutti i pazienti ne presentino le 1

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista
Il miglior software antiplagio

L'unico servizio antiplagio competitivo nel prezzo che garantisce l'aiuto della nostra redazione nel controllo dei risultati.
Analisi sicura e anonima al 100%!
Ottieni un Certificato Antiplagio dopo la valutazione.

Informazioni tesi

  Autore: Marco D'Alessandro
  Tipo: Tesi di Laurea Magistrale
  Anno: 2017-18
  Università: Università degli Studi di Napoli - Federico II
  Facoltà: Scienze Politiche
  Corso: Scienze Statistiche per le decisioni
  Relatore: Francesco Palumbo
  Lingua: Italiano
  Num. pagine: 140

FAQ

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni
Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:
  • perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
  • perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
  • perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.
  • L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
  • Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
  • L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.
L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

cluster analysis
raggruppamento
riduzione della dimensionalità
fuzzy cluster analysis
fuzzy approach

Tesi correlate


Non hai trovato quello che cercavi?


Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

  • individua con precisione le parole chiave specifiche della tua ricerca
  • elimina i termini non significativi (aggettivi, articoli, avverbi...)
  • se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
  • utilizza la ricerca avanzata
  • utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti


Come si scrive una tesi di laurea?


A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.


La tesi l'ho già scritta,
ora cosa ne faccio?


La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi