3
ABSTRACT
La comunicazione vocale delle emozioni è biologicamente adattiva per le specie viventi. Lo
sviluppo del linguaggio, unico per la specie umana, ha fatto valere la voce come un segnale
portante e l’esperienza raccolta nella fase filogenetica ed ontogenetica ha preparato il sistema
uditivo umano ad associare rapidamente vari schemi di energia acustica con la loro
importanza nel comportamento. Gli studi sulle vocalizzazioni, il canto e le proprietà tonali
rilevanti per le espressioni vocali hanno esaminato gli elementi che influenzano direttamente
la percezione e l’individuazione delle emozioni e delle valenze emozionali, aiutando a
comprenderne le associazioni con la musica. Tramite l’analisi di uno studio interculturale in
cinque diversi Paesi è stato approfondito il contesto socio-culturale ed attraverso l’utilizzo
della risonanza magnetica funzionale si è approfondito lo studio dei substrati neuronali
interessati all’elaborazione emotiva, valutando le somiglianze di trasmissione emotiva tra
voce e musica ed esplorando se tali implichino una sovrapposizione di elaborazione
neuronale.
CAPITOLO I Il contenuto emotivo nella voce e nella musica
1. Introduzione
Le emozioni producono cambiamenti pervasivi e dilaganti nell'organismo nel suo complesso,
sebbene generalmente siano di breve durata. Queste modificazioni rappresentano le reazioni
agli eventi di maggiore rilevanza per un individuo e mobilitano tutte le risorse utili per far
fronte alle rispettive situazioni, positive o negative che siano.
La caratteristica più significativa del meccanismo emozionale è il fatto che esso sia in grado
di produrre una specifica prontezza d’azione, fornendo al contempo un periodo di latenza che
consente l’adattamento delle reazioni comportamentali alle richieste situazionali (Frijda,1986;
Schrerer, 1984). Uno degli usi principali di questo periodo di latenza nelle specie viventi
sociali è quello di prevedere la probabile reazione degli altri ad un'azione che è "pronta" per
l'esecuzione come il risultato di un particolare stato emotivo. Per esempio, prima di rimanere
realmente coinvolti in un atto aggressivo e di reagire in maniera violenta, possiamo
inizialmente gridare rabbiosamente contro qualcuno che ci ha offeso, oppure ritirarci e
scappare se ci accorgiamo che l'altro è suscettibile di reagire violentemente.
4
Così, come dimostrato per la prima volta nel classico lavoro di Darwin sulle espressioni delle
emozioni nell'uomo e negli animali (Darwin, 1964), l’espressione emotiva serve per la
funzione vitale di esternalizzare la propensione dell’individuo ad “agire e reagire” e di
comunicare queste informazioni all'ambiente sociale. Proprio come l’emozione è
filogeneticamente continuativa ed appare in forma più o meno rudimentale in molte specie, in
particolare quella dei mammiferi, così accade per l’espressione emotiva, in particolare per
quelle specie dove la vita sociale si basa su complesse interazioni tra gli individui.
Tutte le modalità espressive, in particolare la postura del corpo, i tratti del viso e la
vocalizzazione, sono coinvolte nella comunicazione delle emozioni. Per quanto riguarda
l'espressione del volto, gli scienziati comportamentali e sociali hanno fatto molti progressi
nella raccolta di prove sulla continuità filogenetica (Redican, 1982), l'universalità attraverso le
culture (Ekman, 1973; Izard, 1971), ed il ricco contenuto informativo delle emozioni presente
nelle espressioni facciali (Ekman et al., 1972).
La comunicazione vocale delle emozioni è stata anche oggetto di esame nel campo delle
scienze biologiche e psicologiche, anche se è stata studiata meno frequentemente
dell’espressione facciale.
Sappiamo che la maggior parte delle vocalizzazioni animali sono affettive per loro stessa
natura ma, allo stesso tempo, hanno il ruolo di funzioni rappresentative. (Marler, 1984;
Scherer, 1988). La ricerca sulla comunicazione animale ha dimostrato che in molte specie gli
stati affettivi, generalmente legati alle variazioni di eccitazione fisiologica, sono esternalizzati
in vocalizzi e servono a specifiche funzioni di comunicazione, spesso con il coinvolgimento
di modelli acustici che sono simili in tutte le specie (Jurgens, 1979; Tembrock, 1975). In
stretto parallelo con la vocalizzazione affettiva animale, troviamo ancora fondamenti della
vocalizzazione umana che influenzano il comportamento non verbale, spesso denominate
come "interiezioni", quali possono essere: "ahi", "ai", "oh", "puah", ecc.
Kleinpaul (1972) ha sostenuto che questi riflessivi "suoni della natura e dei sentimenti"
vengono emessi in maniera molto simile quando pronunciati da oratori di differenti culture.
Inoltre ha insistito sulla netta distinzione tra le interiezioni pronunciate spontaneamente o le
esclamazioni che esprimono uno stato emotivo e richiamano o emettono intenzionalmente
delle grida per tentare di comunicare. Wundt (1900) ha segnalato delle vocalizzazioni
riguardanti grida inarticolate o pianti che accompagnano sentimenti molto intensi di
avversione, rabbia e paura. Egli distingue tra (a) interiezioni primarie, definite come "i suoni
della natura" e (b) interiezioni secondarie, le quali diventano assimilati all’interno del
linguaggio. Kainz (1962), ha affermato che con l'avanzare della civiltà le emozioni sono
5
sempre state meno frequentemente espresse per mezzo di puri "'suoni della natura", ma
piuttosto sono state sostituite da interiezioni che sono state assimilate nel linguaggio stesso.
I linguisti interessati alla parola hanno anche trattato questi "frammenti prelinguistici" presenti
nel flusso del parlato. James (1974) ha rivisto i rispettivi scritti di alcuni degli autori classici
nel campo (come ad esempio Bloomfield, Fries, Jespersen, Sapir) ossia tutti coloro che erano
in accordo sul significato affettivo della interiezioni, la loro natura "primitiva”, la natura non-
comunicativa e la loro mancanza di strutture grammaticali.
Scherer (1977) si è focalizzato sulle funzioni di queste vocalizzazioni. Si può dimostrare che
queste servono praticamente in tutta la semantica, sintattica, pragmatica e nella funzione
dialogica del comportamento non verbale delle conversazioni. Goffman (1979) ha fornito
un'analisi delle interiezioni da una visione interazionista. Egli definisce le esclamazioni
separate e non lessicalizzate come "un pianto reattivo", ossia espressioni che egli vede come
"una naturale sovrabbondanza, un allagamento del sentimento contenuto in precedenza, una
rottura dei normali sistemi di ritenuta, un caso classico di qualcuno che viene preso alla
sprovvista."
Storicamente, ci sono stati molti suggerimenti sia da filosofi, per esempio, Rousseau e Herder,
sia da scienziati, come Helmholtz, riguardo il concetto che entrambi i prototipi (del parlato e
della musica) si siano evoluti a partire dall’influenza di una vocalizzazione primitiva. Scherer
(1991) ha approfondito le sue ricerche in seguito a questi primi suggerimenti; egli cita il
lavoro etologico avendo dimostrato che l’espressione e l’impressione sono strettamente
collegati (Andrews, 1972; Leyhausen 1967) e suggerendo che, nel processo di
convenzionalizzazione e ritualizzazione, i segnali espressivi possono essere stati modellati dai
vincoli delle caratteristiche di trasmissione, dalle limitazioni degli organi sensoriali o da altri
fattori non specificati. La conseguente flessibilità del codice di comunicazione può aver
favorito l'evoluzione del linguaggio più astratto e simbolico e di un sistema prettamente
musicale. E’ da notare che tale sviluppo è probabile che si sia verificato in concomitanza con
l'evoluzione e lo sviluppo del cervello. Proprio come le strutture neocorticali più recenti e con
modelli di funzionamento altamente cognitivi si sono sovrapposte alle strutture "emozionali"
più arcaiche (ad esempio il sistema limbico), l'evoluzione del linguaggio umano come sistema
digitale per la codifica e la trasmissione di informazioni (e delle scale musicali e delle
convenzioni del canto) ha fatto uso del cantato analogico più primitivo per influenzare il
sistema di segnalazione come supporto del segnale.
Come la vocalizzazione, che è rimasta una delle principali modalità per l’espressione
dell’emozione analogica, è diventata il sistema di produzione per il più alto, formalizzato,
6
segmentato sistema di linguaggio e canto, entrambe queste funzioni hanno bisogno di essere
utilizzate in contemporanea. Così, nel discorso, i cambiamenti nella frequenza fondamentale
(F0), la struttura formante o le caratteristiche della gamma data dalla sorgente glottidale
possono, a seconda della lingua e del contesto, servire per comunicare i contrasti fonologici,
le scelte sintattiche, il significato pragmatico o l’espressione emotiva. Analogamente nella
musica, la melodia, la struttura armonica o la tempistica possono riflettere le intenzioni del
compositore, a seconda delle specifiche tradizioni della musica, e possono
contemporaneamente indurre forti stati d'animo emozionali (Copeland, 1959; Seashore,
1967). Questa fusione di due sistemi di segnali che sono molto diversi nella funzione e nella
struttura, in un singolo sottostante meccanismo di produzione (la vocalizzazione) ha
dimostrato di essere singolarmente efficace ai fini della comunicazione. E’ stato infatti
affermato che le emozioni differenziano lo spettro dell’espressione vocale umana nel parlato e
nella musica, e che gli ascoltatori sono in grado di eseguire correttamente la deduzione dello
stato emotivo dell’oratore (di un attore o cantante che provano ad ottenere un tale stato) solo e
semplicemente dalla voce.
Se è dimostrato che le emozioni possono essere correttamente identificate dalla voce, allora è
chiaro che le emozioni devono influenzare in modo differenziato il meccanismo di
vocalizzazione e, di conseguenza, rendono dimostrabile le differenze nei modelli acustici
delle relative onde sonore. Nel corso della storia è stato ritenuto evidente il fatto che la voce
umana non solo permette di giudicare le emozioni di chi parla, ma può anche indurre
un’influenza in chi ascolta. In particolare, fin dall'antichità, diverse scuole di retorica hanno
insistito sul potente effetto dato all’ascoltatore da parte dell’espressione emotiva nella voce
(Cicerone, Quintiliano). Anche se tali effetti possono sembrare evidenti, gli scienziati del
comportamento hanno bisogno di prove empiriche dove, in effetti, gli ascoltatori sono in
grado di riconoscere correttamente lo stato emotivo di chi parla solo da spunti vocali,
indipendentemente dalle informazioni del contesto situazionale o altri segnali espressivi,
come possono essere le espressioni del viso, i gesti o la postura.
1.1 Giudicare gli stati emotivi dalla voce
Nel corso degli ultimi 50 anni, molti studi hanno esaminato la capacità degli ascoltatori di
riconoscere o dedurre correttamente lo stato affettivo del parlante o il suo atteggiamento, da
campioni vocali. In generale, i ricercatori hanno chiesto agli oratori (spesso attori, sia
dilettanti che professionisti) di riprodurre vocalmente diversi stati emotivi mentre asserivano