Skip to content

Sistema di interrogazione intelligente di documenti ufficiali del Parlamento Europeo

Argomento principale della tesi in oggetto, e´ riuscire a sfruttare l’analisi della semantica latente [2] (cfr. Cap 2) per poter rappresentare le parole secondo il significato assunto nel contesto in cui si trovano e fornire all’utente un’interfaccia amichevole per il recupero di informazioni. Tale risultato si puo´ ottenere grazie all’analisi di grandi quantita´ di documenti, da cui si possono estrarre relazioni semantiche tra i termini che li compongono, effettuando calcoli statistici sulla frequenza di occorrenza delle singole parole nei documenti al fine di poter rappresentare (cfr. §2.4 e segg.) tutte le parole in uno spazio semantico. E´ possibile inoltre avere una conoscenza generale su un argomento specifico, in base ai documenti successivamente codificati.
Nel caso preso in esame, si e´ realizzata la rappresentazione in uno spazio semantico delle parole dei documenti in lingua inglese facenti parte dell’ archivio del parlamento europeo [1].
In tal modo l’utente del sistema e´ in grado di porre all’applicazione molteplici domande circa un argomento specifico, ricevendo una risposta semanticamente legata alla domanda e non effettuando - come i piu´ diffusi sistemi per il recupero di informazioni (cfr. Cap. 1) - una ricerca lessicale per corrispondenza di termini tra la richiesta dell’utente stesso e tutti i documenti presenti nell’insieme dei testi disponibili.
Attraverso la rappresentazione dei termini nello spazio semantico e´ possibile quindi ottenere sottoinsiemi di parole strettamente legate tra loro dal punto di vista semantico identificando vettori vicini nello spazio di codifica.
A ciascuna parola dello spazio verra´ associata una propria codifica vettoriale che la rappresenta nello spazio semantico considerato, tale codifica e´ necessaria per poter effettuare ad esempio confronti di distanza in modo da trovare parole semanticamente vicine: parole a distanza minore nello spazio n-dimensionale saranno maggiormente legate dal punto di vista semantico rispetto a quanto non lo siano parole le cui rappresentazioni vettoriali si trovino rispettivamente l’uno dall’altro ad una distanza maggiore.
Il primo capitolo riporta un’introduzione al recupero automatico dell’informazione e ai sistemi di recupero di informazione (Information Retrieval - IR), enunciando alcune delle caratteristiche principali dei sistemi di ricerca.
Nel secondo capitolo verra´ esposta la tecnica di analisi della semantica latente per la codifica delle parole e per il recupero di informazioni. Si fara´ inoltre riferimento alla scomposizione ai valori singolari (Singular Value Decomposition - SVD) della matrice utilizzata come base di partenza per la codifica dei termini.
Il capitolo terzo tratta della soluzione proposta, approfondendo le varie parti dello sviluppo dell’applicazione ed illustrando inoltre le tecniche di misura innovative utilizzate per ottenere la risposta piu´ pertinente alle richieste degli utenti.
Nell’ultimo capitolo e´ possibile trovare informazioni di carattere generale sul sistema sviluppato, collezione dei documenti, riferimenti alle piu´ diffuse interfacce di interazione uomo-macchina con un’introduzione ai chat-bot e alle differenze che intercorrono tra tali agenti software - i chat-bot - ed il sistema sviluppato in questa tesi.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista
Mostra/Nascondi contenuto.
7 Introduzione Argomento principale della tesi in oggetto, e´ riuscire a sfruttare l’analisi della semantica latente [2] (cfr. Cap 2) per poter rappresentare le parole secondo il significato assunto nel contesto in cui si trovano e fornire all’utente un’interfaccia amichevole per il recupero di informazioni. Tale risultato si puo´ ottenere grazie all’analisi di grandi quantita´ di documenti, da cui si possono estrarre relazioni semantiche tra i termini che li compongono, effettuando calcoli statistici sulla frequenza di occorrenza delle singole parole nei documenti al fine di poter rappresentare (cfr. §2.4 e segg.) tutte le parole in uno spazio semantico. E´ possibile inoltre avere una conoscenza generale su un argomento specifico, in base ai documenti successivamente codificati. Nel caso preso in esame, si e´ realizzata la rappresentazione in uno spazio semantico delle parole dei documenti in lingua inglese facenti parte dell’ archivio del parlamento europeo [1]. In tal modo l’utente del sistema e´ in grado di porre all’applicazione molteplici domande circa un argomento specifico, ricevendo una risposta semanticamente legata alla domanda e non effettuando - come i piu´ diffusi sistemi per il recupero di informazioni (cfr. Cap. 1) - una ricerca lessicale per corrispondenza di termini tra la richiesta dell’utente stesso e tutti i documenti presenti nell’insieme dei testi disponibili. Attraverso la rappresentazione dei termini nello spazio semantico e´ possibile quindi ottenere sottoinsiemi di parole strettamente legate tra Salvatore La Bua – www.shogoki.it

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

FAQ

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni
Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:
  • perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
  • perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
  • perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.
  • L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
  • Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
  • L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.
L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.

Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

analisi della semantica latente
chat-bot
indicizzazione
lsa
salvatore la bua
scomposizione svd
semantic analisys
svd decomposition

Tesi correlate


Non hai trovato quello che cercavi?


Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

  • individua con precisione le parole chiave specifiche della tua ricerca
  • elimina i termini non significativi (aggettivi, articoli, avverbi...)
  • se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
  • utilizza la ricerca avanzata
  • utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti


Come si scrive una tesi di laurea?


A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.


La tesi l'ho già scritta,
ora cosa ne faccio?


La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi