4
Non avevo mai sentito parlare di ‘semantic prosody’ prima di frequentare un corso di
lingua, parte del mio piano di studi, tenuto dal professore D. Stewart su questo
argomento. Per quanto all’inizio il concetto di prosodia semantica non sia stato
semplice da capire, l’ho trovato interessante e ho deciso di approfondire l’argomento
con questa tesi. La prosodia semantica si inserisce nel campo di studio di una
disciplina relativamente recente che è la linguistica dei corpora, la linguistica che si
basa su dati ottenuti dai corpora, uno strumento che non avevo mai utilizzato, ma che
mi è stato di aiuto nello studio dell’inglese sia per gli aspetti grammaticali, sia
nell’ambito della traduzione.
Lo stesso anno del corso sulla prosodia semantica, al corso di lingua inglese studiavo
le collocazioni tra avverbio aggettivo e dovevo risolvere esercizi del tipo:
It's going to be highly/ deeply/ virtually/ severely/ impossible to get this finished in
time.
La risposta corretta è ‘virtually impossible’, per un parlante madrelingua questo è
immediato, mentre per uno studente l’unica soluzione è imparare a memoria quale
avverbio colloca con un dato aggettivo, perché non c’è alcuna spiegazione per cui
‘virtually impossible’ sia più corretto di ‘highly impossible’.
Although mother tongue intuition guide a native speaker to use a pattern
appropriately, there is no guidance when one wants to pass on this type
of information to learners because this is an area of usage that is
perceived only at a very subliminal level.
1
Con l’utilizzo dei corpora non ho risolto il problema delle collocation che affligge
tutti gli studenti di una lingua straniera, ma so che è più giusto dire ‘virtually
impossible’ perché ‘virtually’ co-occorre più frequentemente di ‘highly’ con
‘impossible’, inoltre prima di fare uno studio mnemonico, posso verificare
autonomamente quale sia la giusta collocazione di qualsiasi parola con uno
strumento che si basa su testi reali e avere molti esempi a disposizione per
interiorizzarla. Se dalla ricerca nel corpus si nota una tendenza della parola a co-
occorrere con elementi appartenenti ad una determinata categoria semantica è anche
più facile individuare le corrette co-occorrenze. Ad esempio l’avverbio ‘utterly’ si
1
Tognini-Bonelli (2001) Pp. 22-23
5
trova spesso con aggettivi come ‘frustrating’, ‘devastating’, ‘confused’, da questo si
può intuire che ‘utterly’, nella maggior parte dei casi, viene utilizzato con aggettivi
dalla connotazione negativa e che ‘utterly enjoyed’ non è una collocazione frequente.
L’avverbio ‘giusto’ per ‘enjoyed’ è ‘thoroughly’; nonostante ‘thoroughly’ e ‘utterly’
possano essere considerati sinonimi vengono utilizzati in contesti diversi, i dati
ottenuti dai corpora permettono di trovare le giuste collocazioni.
In modo meno affidabile rispetto ai corpora (per la varietà di provenienza dei
contenuti del web) scrivendo “virtually impossibile” sul motore di ricerca Google si
hanno oltre 1.300.000 risultati, mentre scrivendo “highly impossibile” i risultati sono
14.500 e per di più Google suggerisce: ‘forse cercavi: highly possible’ che è una
collocazione molto più probabile. Sbagliare una collocazione raramente preclude la
comprensione del messaggio, tuttavia parlare con le collocazioni appropriate è
determinante per un ottenere un livello linguistico avanzato.
Per un parlante nativo, sottoposto a stimoli linguistici fin dall’infanzia, utilizzare le
giuste collocazioni è istintivo, anche se si può sempre migliorare: quando si dice che
per parlare e scrivere bene si deve leggere molto è perché leggendo (oltre ad
arricchire il lessico) ci si abitua a riconoscere le parole che ‘vanno bene insieme’ o
che ‘suonano bene’ così da riprodurre poi le giuste combinazioni di parole e saper
scegliere la parola giusta in base al contesto. Per chi apprende una lingua straniera
produrre un testo, che sia orale o scritto, non solo corretto, ma che risulti naturale,
non è facile perché si tende a riprodurre strutture e collocazioni della lingua madre.
Sulla produzione scritta si può lavorare e apportare migliorie grazie a vari strumenti,
i corpora sono sicuramente uno di questi; in particolare ritengo che siano molto utili
quando si tratta di traduzione. Quando si traduce ci si aiuta soprattutto con i
dizionari, ma il semplice significato di una parola a volte non basta per operare una
scelta traduttiva adatta a un determinato contesto. Se così fosse da una traduzione
letterale si otterrebbe un testo coerente e naturale. Invece è necessario scegliere la
parola nella lingua di arrivo adatta a quel contesto non solo in base al significato, ma
anche facendo attenzione che si leghi bene alle parole che segue e a quelle che
precede e che il testo prodotto sia naturale nella lingua di arrivo.
6
“Naturale” perché quando parliamo o scriviamo non scegliamo le parole ad una ad
una, c’è una interrelazione tra di esse da cui non si può prescindere.
Our knowledge of a language is not only a knowledge of individual
words, but of their predictable combinations, and of the cultural
knowledge which these combinations often encapsulate
2
Insegnando italiano a studenti stranieri mi sono trovata a rispondere a domande del
tipo “Perché non si dice ‘mangio la cena’ alle 20?”. In effetti questa combinazione a
livello di significato ha perfettamente senso, perché a cena si mangia. Tuttavia un
parlante nativo direbbe ‘faccio cena’ o ‘ceno’ alle 20; il motivo è una questione di
co-occorrenza. Ogni parola può predire le sue co-occorrenze, tuttavia nel passaggio
da una lingua ad un’altra non è detto che parole con lo stesso significato, come ad
esempio ‘mangiare’ e ‘eat’, abbiano le stesse possibili co-occorrenze, ‘mangiare la
cena’ in italiano risulta poco frequente, mentre in inglese la combinazione ‘eat
dinner’ è possibile e frequente.
Nell’ambito della traduzione verificare se una combinazione è frequente, o cercare la
giusta co-occorrenza di una parola, sono modi per avere una traduzione più accurata
e naturale. Per questo motivo può risultare molto utile l’impiego dei corpora a fini
traduttivi.
Gli studi sulla prosodia semantica si occupano del significato delle parole, si basano
sul fatto che il significato non appartiene alla singola parola, ma ad una più estesa
unità di significato. In una frase il senso non è dato dalla somma dei significati di
ogni parola: è piuttosto la frase a dare il significato alle parole. Basti pensare che il
significato di una parola raramente è unico, ad esempio ‘corretto’ può avere diversi
significati, ma in ognuno dei seguenti contesti non c’è ambiguità: ‘una persona
corretta’, ‘un caffè corretto’, ‘un esercizio corretto’. Ciò significa che a far capire il
significato di una parola contribuiscono le sue co-occorrenze. Inoltre, attraverso i dati
ottenuti dalla ricerca nei corpora si può notare che le co-occorrenze di una parola
spesso sono legate a livello semantico: secondo gli studi sulla prosodia semantica
queste co-occorrenze contribuirebbero al significato della parola.
2
Stubbs (2001) P.3
7
Nel primo capitolo spiegherò che cosa sono i corpora, come si utilizzano e quali sono
le principali definizioni e le caratteristiche condivise della prosodia semantica, ma
anche le critiche che hanno generato.
Nel secondo capitolo per spiegare il concetto di prosodia semantica e altri fenomeni
legati ad essa, come le collocative clashes, analizzerò Shaking contagion, una
commedia sulla prosodia semantica scritta dal professor D. Stewart.
Nel terzo capitolo analizzerò alcuni termini già studiati nella letteratura della
prosodia semantica ricercando le loro co-occorrenze in vari tabloid inglesi, per
verificarne l’uso in un linguaggio attuale e non troppo lontano dal parlato. Inoltre
riporterò le definizioni di alcuni dizionari dei termini studiati, per scoprire se rendano
conto o meno della prosodia semantica associata alla parola.
9
L’importanza dei corpora
Nell’ambito della linguistica dei corpora in cui si inserisce la prosodia
semantica un corpus può essere definito come:
a collection of texts assumed to be representative of a given language put
together so that it can be used for linguistic analysis.
3
Un corpus contiene testi scritti e trascrizioni di testi orali che si presuppone siano
esempi di lingua naturale e autentica, è quindi rappresentativo di una data lingua.
Prima della diffusione dei corpora elettronici i linguisti si basavano
sull’osservazione diretta di testi scritti e orali. Ciò poneva inevitabilmente dei limiti
all’analisi linguistica, sia per quanto riguarda la quantità di testi sia in termini di
tempo impiegato per analizzarli. L’utilizzo del computer e di internet ha innanzitutto
aumentato esponenzialmente la quantità di dati e quindi di materiale linguistico a
disposizione, per esempio il COCA (Corpus of Contemporary American English)
contiene più di 450 milioni di parole; ma soprattutto la tecnologia ha dato la
possibilità di ricavare più velocemente le informazioni dai corpora. Queste novità
quantitative e qualitative hanno reso la ricerca linguistica più accurata e affidabile di
quanto non fosse prima dell’utilizzo dei computer e di internet.
Come si ricavano informazioni dai corpora
L’analisi di un elemento linguistico attraverso un corpus è di tipo induttivo, cioè si
parte dallo studio dei dati per poi ricavarne osservazioni teoriche.
Esistono vari modi di interrogare un corpus. Ricercando una parola si ottengono tutte
le occorrenze di quella parola nel corpus e il punto di partenza per analizzarle sono le
concordance lines: attraverso il formato KWIC (Key Word In Context) la parola o
l’espressione selezionata (chiamata node) viene allineata al centro, e a destra e a
sinistra vi è il suo contesto (vedi tabella). A questo punto si cerca di individuare i
pattern che si ripetono frequentemente tra le co-occorrenze, ad esempio si
raggruppano co-occorrenze che appartengono alla stessa categoria grammaticale o
semantica.
1 Experts explain that exercise can not cause heart disease or a tendency to accumulate
3
Baker, Francis, Tognini-Bonelli (1993) P.2
10
2 too busy ; a worker might deliberately cause his machine to break down . Negative power is
3 that dieting and exercises together can cause hormonal imbalances , infertility and period loss
4 because of ingrained attitudes which cause human behaviour to change slower than the
5 quite right abhors tactics which can easily cause injury . It is interesting to note , therefore , that
6 the baby will hit the straps and it will cause injury . The solution is a seat fitting kit a
7 of the plant 's smelting room . The cause is not yet known . # Police have released a
8 Such a development will cause me no little difficulty -- especially from the SNP !
Il node può essere formato da una singola parola, ma anche da un’espressione, o da
un verbo in tutte le sue forme, ad esempio cercando [CAUSE] nel BNC nel node si
trovano ‘cause, caused, causing ecc.’. Si può anche affinare la ricerca a seconda della
categoria grammaticale delle co-occorrenze a cui si è interessati, ad esempio trovare
tutti i sostantivi alla destra del node.
Tognini-Bonelli
4
sottolinea che sebbene un corpus sia costituito da testi, non è
corretto analizzare i dati di un corpus come si analizza un testo. Un testo si legge
orizzontalmente, in modo unitario, lo scopo della lettura è il suo contenuto ed è
considerato un’istanza individuale, mentre un corpus si legge verticalmente e in
modo frammentario, con lo scopo di trovare strutture che si ripetono per fare
generalizzazioni sulla lingua e dare prove sull’uso sociale di quella determinata
parola.
Tuttavia, qualora se ne avesse bisogno, il corpus permette anche di studiare il singolo
testo di cui fa parte un’occorrenza espandendo l’asse orizzontale delle concordanze.
Si inizia cercando parole che si ripetono nell’immediato contesto a sinistra e a destra
del node iniziando con il pattern più evidente. A questo punto si fanno ipotesi che
possano legare le parole tra loro: potrebbero essere parole che appartengono allo
stesso campo semantico o alla stessa categoria grammaticale. Potrebbe essere
necessario modificare le ipotesi formulate, ad esempio rendendole più generali, se
così facendo si includono molte più istanze. Si ripete il processo per altri pattern e
infine si raggruppano le ipotesi raccolte.
Oltre alle concordance lines, un altro strumento per esaminare i dati dei corpora sono
i profili lessicali (lexical profiles), una lista delle co-occorrenze più frequenti di una
data parola. Per creare un profilo lessicale si considera un certo numero di co-
occorrenze a destra e a sinistra del node (questo intervallo è chiamato span), di solito
4
Baker, Francis, Tognini-Bonelli (1993) P.3
11
4:4
5
, cioè vengono considerate quatto co-occorrenze alla sinistra (chiamate N-1, N-2
ecc.) e 4 co-occorrenze alla destra del node (chiamate N+1, N+2 ecc.). Stubbs fa il
seguente esempio:
Seeking 11,735 <asylum, help, advice, support, information> 9%
6
Questo profilo lessicale mostra che ‘seeking’ ha 11,735 occorrenze totali nel corpus
(Cobuild 1995) e nel 9% dei casi co-occorre con una delle 5 parole indicate. La
percentuale di frequenza, può anche essere sostituita da un numero per ogni parola
che indica quante volte essa co-occorre col node.
Un altro modo di visualizzare le informazioni dei corpora sono le collocational
clouds. Inizialmente utilizzate nel web, queste ‘nuvole’ di parole possono essere
utilizzate in ambito linguistico per visualizzare velocemente le collocazioni più
frequenti di una parola; le informazioni sono trasmesse attraverso la grafica: la
frequenza è rappresentata dalla grandezza del carattere (più grande = più frequente),
la sua forza collocazionale, cioè la MI ‘mutual information’, che calcola quanto
quella parola co-occorre esclusivamente con il node, viene rappresentata dal colore
(più chiaro = maggiore MI). Le parole appaiono in ordine alfabetico quindi sono
facili da rintracciare. Inoltre passando il mouse sopra una collocazione vengono
visualizzate la sua frequenza e la MI. Un’altra caratteristica interessante è la
possibilità di creare una nuova nuvola di collocazioni per ognuna delle parole nella
collocational cloud semplicemente cliccando su una co-occorrenza che diventerà il
nuovo node. Sebbene non possano sostituire i dati numerici, le collocational clouds
offrono un modo veloce di navigare attraverso i dati linguistici. La figura 1 mostra
come appare la collocational cloud della parola CAUSE. Tralasciando gli elementi
grammaticali possiamo notare che la co-occorrenza più frequente (quella
graficamente più grande) è ‘problem’ e quella con la M.I. più alta (la più luminosa) è
‘harm’ altre frequenti co-occorrenze per CAUSE sono ‘damage’, ‘concern’, ‘death’,
‘trouble’, ‘effect’ e ‘action’.
Fig.1
7
5
“There is some consensus, but not total agreement, that significant collocates are usually found
within a span of 4:4.” Stubbs (2001) P. 29
6
Ibid. P.30
7
http://www.scottishcorpus.ac.uk/corpus/bnc/collocatecloud.php?word=cause
12
cause
a action all also an and any are as at be because
been but by can common concern could damagede
ath did disease do does effect even for from good had harm
has have he her him his however i if in is it its likelymain
major many may might more most much no not n't of o
n one only or other our people problem problems 'sserious
she should so some such than that the their them t
here these they this those to trouble very was wewere
what when which who will with without would you your