Skip to content

L’annotazione nella linguistica dei corpora


La formattazione dei documenti e l’elaborazione di un software adeguato sono condizioni necessarie per giungere a visualizzare velocemente le concordanze delle parole selezionato. Facendo riferimento al formato KWIC (Key Word in Context), la parola in esame viene presentata al centro dello schermo, nell’ambito del contesto di ricorrenza.

Un problema si pone nell’interrogazione del data base corpus, ad esempio nel caso di una lingua ricca di forme flesse come l’italiano. Necessario è il ricorso ad esempio a opportuni criteri per evitare le interferenze di omografi e non invalidare il calcolo di frequenza delle concordanze.

Tratto da INTRODUZIONE ALLA LINGUISTICA APPLICATA di Domenico Valenza
Valuta questi appunti:

Continua a leggere:

Dettagli appunto:

Altri appunti correlati:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.