4 
 
Non avevo mai sentito parlare di ‘semantic prosody’ prima di frequentare un corso di 
lingua, parte del mio piano di studi, tenuto dal professore D. Stewart su questo 
argomento. Per quanto all’inizio il concetto di prosodia semantica non sia stato 
semplice da capire, l’ho trovato interessante e ho deciso di approfondire l’argomento 
con questa tesi. La prosodia semantica si inserisce nel campo di studio di una 
disciplina relativamente recente che è la linguistica dei corpora, la linguistica che si 
basa su dati ottenuti dai corpora, uno strumento che non avevo mai utilizzato, ma che 
mi è stato di aiuto nello studio dell’inglese sia per gli aspetti grammaticali, sia 
nell’ambito della traduzione. 
Lo stesso anno del corso sulla prosodia semantica, al corso di lingua inglese studiavo 
le collocazioni tra avverbio aggettivo e dovevo risolvere esercizi del tipo: 
It's going to be highly/ deeply/ virtually/ severely/ impossible to get this finished in 
time. 
La risposta corretta è ‘virtually impossible’, per un parlante madrelingua questo è 
immediato, mentre per uno studente l’unica soluzione è imparare a memoria quale 
avverbio colloca con un dato aggettivo, perché non c’è alcuna spiegazione per cui 
‘virtually impossible’ sia più corretto di ‘highly impossible’.  
Although mother tongue intuition guide a native speaker to use a pattern 
appropriately, there is no guidance when one wants to pass on this type 
of information to learners because this is an area of usage that is 
perceived only at a very subliminal level.
1
  
Con l’utilizzo dei corpora non ho risolto il problema delle collocation che affligge 
tutti gli studenti di una lingua straniera, ma so che è più giusto dire ‘virtually 
impossible’ perché ‘virtually’ co-occorre più frequentemente di ‘highly’ con 
‘impossible’, inoltre prima di fare uno studio mnemonico, posso verificare 
autonomamente quale sia la giusta collocazione di qualsiasi parola con uno 
strumento che si basa su testi reali e avere molti esempi a disposizione per 
interiorizzarla. Se dalla ricerca nel corpus si nota una tendenza della parola a co-
occorrere con elementi appartenenti ad una determinata categoria semantica è anche 
più facile individuare le corrette co-occorrenze. Ad esempio l’avverbio ‘utterly’ si 
                                                           
1
 Tognini-Bonelli (2001) Pp. 22-23
5 
 
trova spesso con aggettivi come ‘frustrating’, ‘devastating’, ‘confused’, da questo si 
può intuire che ‘utterly’, nella maggior parte dei casi, viene utilizzato con aggettivi 
dalla connotazione negativa e che ‘utterly enjoyed’ non è una collocazione frequente. 
L’avverbio ‘giusto’ per ‘enjoyed’ è ‘thoroughly’; nonostante ‘thoroughly’ e ‘utterly’ 
possano essere considerati sinonimi vengono utilizzati in contesti diversi, i dati 
ottenuti dai corpora permettono di trovare le giuste collocazioni. 
In modo meno affidabile rispetto ai corpora (per la varietà di provenienza dei 
contenuti del web) scrivendo “virtually impossibile” sul motore di ricerca Google si 
hanno oltre 1.300.000 risultati, mentre scrivendo “highly impossibile” i risultati sono 
14.500 e per di più Google suggerisce: ‘forse cercavi: highly possible’ che è una 
collocazione molto più probabile. Sbagliare una collocazione raramente preclude la 
comprensione del messaggio, tuttavia parlare con le collocazioni appropriate è 
determinante per un ottenere un livello linguistico avanzato.  
Per un parlante nativo, sottoposto a stimoli linguistici fin dall’infanzia, utilizzare le 
giuste collocazioni è istintivo, anche se si può sempre migliorare: quando si dice che 
per parlare e scrivere bene si deve leggere molto è perché leggendo (oltre ad 
arricchire il lessico) ci si abitua a riconoscere le parole che ‘vanno bene insieme’ o 
che ‘suonano bene’ così da riprodurre poi le giuste combinazioni di parole e saper 
scegliere la parola giusta in base al contesto. Per chi apprende una lingua straniera 
produrre un testo, che sia orale o scritto, non solo corretto, ma che risulti naturale,  
non è facile perché si tende a riprodurre strutture e collocazioni della lingua madre. 
Sulla produzione scritta si può lavorare e apportare migliorie grazie a vari strumenti, 
i corpora sono sicuramente uno di questi; in particolare ritengo che siano molto utili 
quando si tratta di traduzione. Quando si traduce ci si aiuta soprattutto con i 
dizionari, ma il semplice significato di una parola a volte non basta per operare una 
scelta traduttiva adatta a un determinato contesto. Se così fosse da una traduzione 
letterale si otterrebbe un testo coerente e naturale. Invece è necessario scegliere la 
parola nella lingua di arrivo adatta a quel contesto non solo in base al significato, ma 
anche facendo attenzione che si leghi bene alle parole che segue e a quelle che 
precede e che il testo prodotto sia naturale nella lingua di arrivo.
6 
 
“Naturale” perché quando parliamo o scriviamo non scegliamo le parole ad una ad 
una, c’è una interrelazione tra di esse da cui non si può prescindere. 
 Our knowledge of a language is not only a knowledge of individual 
words, but of their predictable combinations, and of the cultural 
knowledge which these combinations often encapsulate
2
 
Insegnando italiano a studenti stranieri mi sono trovata a rispondere a domande del 
tipo “Perché non si dice ‘mangio la cena’ alle 20?”. In effetti questa combinazione a 
livello di significato ha  perfettamente senso, perché a cena si mangia. Tuttavia un 
parlante nativo direbbe ‘faccio cena’ o ‘ceno’ alle 20; il motivo è una questione di 
co-occorrenza. Ogni parola può predire le sue co-occorrenze, tuttavia nel passaggio 
da una lingua ad un’altra non è detto che parole con lo stesso significato, come ad 
esempio ‘mangiare’ e ‘eat’, abbiano le stesse possibili co-occorrenze, ‘mangiare la 
cena’ in italiano risulta poco frequente, mentre in inglese la combinazione ‘eat 
dinner’ è possibile e frequente. 
Nell’ambito della traduzione verificare se una combinazione è frequente, o cercare la 
giusta co-occorrenza di una parola, sono modi per avere una traduzione più accurata 
e naturale. Per questo motivo può risultare molto utile l’impiego dei corpora a fini 
traduttivi.  
Gli studi sulla prosodia semantica si occupano del significato delle parole, si basano 
sul fatto che il significato non appartiene alla singola parola, ma ad una più estesa 
unità di significato. In una frase il senso non è dato dalla somma dei significati di 
ogni parola: è piuttosto la frase a dare il significato alle parole. Basti pensare che il 
significato di una parola raramente è unico, ad esempio ‘corretto’ può avere diversi 
significati, ma in ognuno dei seguenti contesti non c’è ambiguità: ‘una persona 
corretta’, ‘un caffè corretto’, ‘un esercizio corretto’. Ciò significa che a far capire il 
significato di una parola contribuiscono le sue co-occorrenze. Inoltre, attraverso i dati 
ottenuti dalla ricerca nei corpora si può notare che le co-occorrenze di una parola 
spesso sono legate a livello semantico: secondo gli studi sulla prosodia semantica 
queste co-occorrenze contribuirebbero al significato della parola.  
                                                           
2
 Stubbs (2001) P.3
7 
 
Nel primo capitolo spiegherò che cosa sono i corpora, come si utilizzano e quali sono 
le principali definizioni e le caratteristiche condivise della prosodia semantica, ma 
anche le critiche che hanno generato.  
Nel secondo capitolo per spiegare il concetto di prosodia semantica e altri fenomeni 
legati ad essa, come le collocative clashes, analizzerò Shaking contagion, una 
commedia sulla prosodia semantica scritta dal professor D. Stewart. 
Nel terzo capitolo analizzerò alcuni termini già studiati nella letteratura della 
prosodia semantica ricercando le loro co-occorrenze in vari tabloid inglesi, per 
verificarne l’uso in un linguaggio attuale e non troppo lontano dal parlato. Inoltre 
riporterò le definizioni di alcuni dizionari dei termini studiati, per scoprire se rendano 
conto o meno della prosodia semantica associata alla parola.
9 
 
L’importanza dei corpora 
Nell’ambito della linguistica dei corpora in cui si inserisce la prosodia 
semantica un corpus può essere definito come: 
a collection of texts assumed to be representative of a given language put 
together so that it can be used for linguistic analysis.
3
 
Un corpus contiene testi scritti e trascrizioni di testi orali che si presuppone siano 
esempi di lingua naturale e autentica, è quindi rappresentativo di una data lingua.  
 Prima della diffusione dei corpora elettronici i linguisti si basavano 
sull’osservazione diretta di testi scritti e orali. Ciò poneva inevitabilmente dei limiti 
all’analisi linguistica, sia per quanto riguarda la quantità di testi sia in termini di 
tempo impiegato per analizzarli. L’utilizzo del computer e di internet ha innanzitutto 
aumentato esponenzialmente la quantità di dati e quindi di materiale linguistico a 
disposizione, per esempio il COCA (Corpus of Contemporary American English) 
contiene più di 450 milioni di parole; ma soprattutto la tecnologia ha dato la 
possibilità di ricavare più velocemente le informazioni dai corpora. Queste novità 
quantitative e qualitative hanno reso la ricerca linguistica più accurata e affidabile di 
quanto non fosse prima dell’utilizzo dei computer e di internet. 
 
Come si ricavano informazioni dai corpora 
L’analisi di un elemento linguistico attraverso un corpus è di tipo induttivo, cioè si 
parte dallo studio dei dati per poi ricavarne osservazioni teoriche.  
Esistono vari modi di interrogare un corpus. Ricercando una parola si ottengono tutte 
le occorrenze di quella parola nel corpus e il punto di partenza per analizzarle sono le 
concordance lines: attraverso il formato KWIC (Key Word In Context) la parola o 
l’espressione selezionata (chiamata node) viene allineata al centro, e a destra e a 
sinistra vi è il suo contesto (vedi tabella). A questo punto si cerca di individuare i 
pattern che si ripetono frequentemente tra le co-occorrenze, ad esempio si 
raggruppano co-occorrenze che appartengono alla stessa categoria grammaticale o 
semantica. 
1 Experts explain  that  exercise  can  not    cause    heart  disease or  a  tendency to accumulate  
                                                           
3
 Baker, Francis, Tognini-Bonelli (1993) P.2
10 
 
2 too busy ;  a  worker  might  deliberately    cause    his   machine   to   break  down . Negative power is  
3  that dieting  and  exercises  together  can    cause    hormonal   imbalances   ,   infertility  and period loss  
4 because  of  ingrained  attitudes  which    cause    human   behaviour   to   change  slower than the  
5 quite right abhors  tactics  which  can  easily    cause    injury   .   It   is  interesting to note , therefore , that  
6 the baby will hit the  straps  and  it  will    cause    injury   .   The   solution  is a seat fitting kit a  
7 of the plant 's  smelting  room  .  The    cause    is   not   yet   known  . # Police have released a  
8 Such  a  development  will    cause    me   no   little   difficulty  -- especially from the SNP !  
 
Il node può essere formato da una singola parola, ma anche da un’espressione, o da 
un verbo in tutte le sue forme, ad esempio cercando [CAUSE] nel BNC nel node si 
trovano ‘cause, caused, causing ecc.’. Si può anche affinare la ricerca a seconda della 
categoria grammaticale delle co-occorrenze a cui si è interessati, ad esempio trovare 
tutti i sostantivi alla destra del node. 
Tognini-Bonelli
4
 sottolinea che sebbene un corpus sia costituito da testi, non è 
corretto analizzare i dati di un corpus come si analizza un testo. Un testo si legge 
orizzontalmente, in modo unitario, lo scopo della lettura è il suo contenuto ed è 
considerato un’istanza individuale, mentre un corpus si legge verticalmente e in 
modo frammentario, con lo scopo di trovare strutture che si ripetono per fare 
generalizzazioni sulla lingua e dare prove sull’uso sociale di quella determinata 
parola.   
Tuttavia, qualora se ne avesse bisogno, il corpus permette anche di studiare il singolo 
testo di cui fa parte un’occorrenza espandendo l’asse orizzontale delle concordanze. 
Si inizia cercando parole che si ripetono nell’immediato contesto a sinistra e a destra 
del node iniziando con il pattern più evidente. A questo punto si fanno ipotesi che 
possano legare le parole tra loro: potrebbero essere parole che appartengono allo 
stesso campo semantico o alla stessa categoria grammaticale. Potrebbe essere 
necessario modificare le ipotesi formulate, ad esempio rendendole più generali, se 
così facendo si includono molte più istanze. Si ripete il processo per altri pattern e 
infine si raggruppano le ipotesi raccolte. 
Oltre alle concordance lines, un altro strumento per esaminare i dati dei corpora sono 
i profili lessicali (lexical profiles), una lista delle co-occorrenze più frequenti di una 
data parola. Per creare un profilo lessicale si considera un certo numero di co-
occorrenze a destra e a sinistra del node (questo intervallo è chiamato span), di solito 
                                                           
4
 Baker, Francis, Tognini-Bonelli (1993) P.3
11 
 
4:4
5
, cioè vengono considerate quatto co-occorrenze alla sinistra (chiamate N-1, N-2 
ecc.) e 4 co-occorrenze alla destra del node (chiamate N+1, N+2 ecc.). Stubbs fa il 
seguente esempio: 
Seeking 11,735 <asylum, help, advice, support, information> 9%
6
 
Questo profilo lessicale mostra che ‘seeking’ ha 11,735 occorrenze totali nel corpus 
(Cobuild 1995) e nel 9% dei casi co-occorre con una delle 5 parole indicate. La 
percentuale di frequenza, può anche essere sostituita da un numero per ogni parola 
che indica quante volte essa co-occorre col node. 
Un altro modo di visualizzare le informazioni dei corpora sono le collocational 
clouds. Inizialmente utilizzate nel web, queste ‘nuvole’ di parole possono essere 
utilizzate in ambito linguistico per visualizzare velocemente le collocazioni più 
frequenti di una parola; le informazioni sono trasmesse attraverso la grafica: la 
frequenza è rappresentata dalla grandezza del carattere (più grande = più frequente), 
la sua forza collocazionale, cioè la MI ‘mutual information’, che calcola quanto 
quella parola co-occorre esclusivamente con il node, viene rappresentata dal colore 
(più chiaro = maggiore MI). Le parole appaiono in ordine alfabetico quindi sono 
facili da rintracciare. Inoltre passando il mouse sopra una collocazione vengono 
visualizzate la sua frequenza e la MI. Un’altra caratteristica interessante è la 
possibilità di creare una nuova nuvola di collocazioni per ognuna delle parole nella 
collocational cloud semplicemente cliccando su una co-occorrenza che diventerà il 
nuovo node. Sebbene non possano sostituire i dati numerici, le collocational clouds 
offrono un modo veloce di navigare attraverso i dati linguistici. La figura 1 mostra 
come appare la collocational cloud della parola CAUSE. Tralasciando gli elementi 
grammaticali possiamo notare che la co-occorrenza più frequente (quella 
graficamente più grande) è ‘problem’ e quella con la M.I. più alta (la più luminosa) è 
‘harm’ altre frequenti co-occorrenze per CAUSE sono ‘damage’, ‘concern’, ‘death’, 
‘trouble’, ‘effect’ e ‘action’. 
Fig.1
7
 
                                                           
5
 “There is some consensus, but not total agreement, that significant collocates are usually found 
within a span of 4:4.” Stubbs (2001) P. 29 
6
Ibid. P.30  
7
 http://www.scottishcorpus.ac.uk/corpus/bnc/collocatecloud.php?word=cause
12 
 
cause 
a action all also an and any are as at be because 
been but by can common concern could damagede
ath did disease do does effect even for from good had harm
 has have he her him his however i if in is it its likelymain 
major many may might more most much no not n't of o
n one only or other our people problem problems 'sserious
 she should so some such than that the their them t
here these they this those to trouble very was wewere 
what when which who will with without would you your