Skip to content

Annotazioni linguistiche: una rassegna

This document will deal with Linguistic Annotations applied to computer science, discussing how much it is important to express information on a language resource, and what instruments does IT provide to this purpose. It will provide a review of some practical examples of Linguistic Annotations, particularly focusing on the work of ISO, which has formed a working group [WitBro2002] to discuss the issues of linguistic annotation, analyse existent solutions and find a standard for annotating resources.
Language is the way in which a living being expresses itself. Is it movement, gesture, sound, verse or sign, language gives a being the ability to communicate, that is entering in relation with the world that surrounds it, from earth and sky to other living creatures.
Everything that lives does communication, from the smallest cell to the biggest animal. A cell can move, or contract, a bee dances to indicate fellow bees how to find a flower, dolphins and whales use ultrasounds to locate food and threats, many male animals use particular behaviours to court females. Lack of communication is quite a synonym for death, so the necessity to use a language is as old as the presence of life on Earth.
Whatever language we consider, one feature is always present: needing to be understandable, communication between living beings of the same kind must use a common code, accepted and adopted by everyone, that permanently associates a particular sign (gesture, verse, writing etc.) with a precise meaning. For example, a cat curves its back and erects his hair to defy an enemy, and a dog shakes its tail when it is happy.
The necessity of sharing a common code of communication, written or spoken, traded to next generations genetically or trough learning, is a way of expressing information on a linguistic content (or language resource, as it will be called in this document), that is a linguistic annotation.
Humans have developed a great variety of languages, starting from gestures in their early existence on Earth, followed by spoken words and finally written content. Writing, in turn, originated as a way to express ideas with signs, and then took a syllabic/phonetic approach, focusing more on the description of sounds than on their meaning. Meanwhile, humans settled across the entire planet, without easy communication between people so widely spread. This situation facilitated the differentiation of languages, but when technological progress made communication easier again the need for interoperating languages raised.
It is necessary to translate words and phrases from one language to another, but to do this the structure of text had to be found. This was the first linguistic annotation, or classification of parts of the discourse based on its logical or grammatical structure. This is the typical way teachers use to present a language to their students.
Another approach is that made by those who study pronunciation of words, trying to find a common code to express the sounds made by the voice to say a word. In this way, they created a phonetic alphabet, which could be suitable for pronunciation of every natural language spoken by men.
The latter and more versatile approach is focusing on the semantics: the information the Linguistic Annotation has to carry now concerns the meaning of the resource it annotates. We could tell when and where a certain quote was said, and who said it, or we could do a summary of that quote, pointing out the key information. We could find relations between that quote and other quotes of the same speaker, about the same content, or with the same opinion, for further research. This is the typical work of journalists.
Technology progress made categorization of language resources not only reliant on writing, but also on audio and video, and the birth of computers, although a little lately, raised their accessibility and usability. In the last years, attempts to automate also the annotations were made, especially with the growth of mark-up languages like HTML and XML, very suitable for this purpose. Recently, ISO had recognized the importance of annotations and created a working group to discuss these issues and find out a standard solution.
The first chapter will introduce the problem and make a summary of the rest of the document. The second chapter will discuss the general aspects of linguistic annotation, in particular the different approaches to annotation and what are the most used instruments to implement them on computer systems. Chapter 3 will show some examples of computer-based linguistic annotation, chosen to embrace all kinds of approach and implementation. Chapter 4 will focus on the process of standardization for language resources, and especially on the ISO work. Chapter 5 will draw conclusions.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista
Mostra/Nascondi contenuto.
Abstract ABSTRACT 5 This document will deal with Linguistic Annotations applied to computer science, discussing how much it is important to express information on a language resource, and what instruments does IT provide to this purpose. It will provide a review of some practical examples of Linguistic Annotations, particularly focusing on the work of ISO, which has formed a working group [WitBro2002] to discuss the issues of linguistic annotation, analyse existent solutions and find a standard for annotating resources. Language is the way in which a living being expresses itself. Is it movement, gesture, sound, verse or sign, language gives a being the ability to communicate, that is entering in relation with the world that surrounds it, from earth and sky to other living creatures. Everything that lives does communication, from the smallest cell to the biggest animal. A cell can move, or contract, a bee dances to indicate fellow bees how to find a flower, dolphins and whales use ultrasounds to locate food and threats, many male animals use particular behaviours to court females. Lack of communication is quite a synonym for death, so the necessity to use a language is as old as the presence of life on Earth. Whatever language we consider, one feature is always present: needing to be understandable, communication between living beings of the same kind must use a common code, accepted and adopted by everyone, that permanently associates a particular sign (gesture, verse, writing etc.) with a precise meaning. For example, a cat curves its back and erects his hair to defy an enemy, and a dog shakes its tail when it is happy. The necessity of sharing a common code of communication, written or spoken, traded to next generations genetically or trough learning, is a way of expressing information on a linguistic content (or language resource, as it will be called in this document), that is a linguistic annotation. Humans have developed a great variety of languages, starting from gestures in their early existence on Earth, followed by spoken

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista
Il miglior software antiplagio

L'unico servizio antiplagio competitivo nel prezzo che garantisce l'aiuto della nostra redazione nel controllo dei risultati.
Analisi sicura e anonima al 100%!
Ottieni un Certificato Antiplagio dopo la valutazione.

Informazioni tesi

  Autore: Mattia Gentilini
  Tipo: Laurea I ciclo (triennale)
  Anno: 2001-02
  Università: Università degli Studi di Bologna
  Facoltà: Scienze Matematiche, Fisiche e Naturali
  Corso: Scienze e tecnologie informatiche
  Relatore: Fabio Vitali
  Lingua: Italiano
  Num. pagine: 101

FAQ

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni
Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:
  • perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
  • perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
  • perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.
  • L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
  • Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
  • L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.
L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

xml
analisi linguistica
annotazioni linguistiche

Tesi correlate


Non hai trovato quello che cercavi?


Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

  • individua con precisione le parole chiave specifiche della tua ricerca
  • elimina i termini non significativi (aggettivi, articoli, avverbi...)
  • se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
  • utilizza la ricerca avanzata
  • utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti


Come si scrive una tesi di laurea?


A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.


La tesi l'ho già scritta,
ora cosa ne faccio?


La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi