ABSTRACT
The subject of the present work is Respeaking: a new technique which has proved to be very
useful to produce real-time, intra-lingual subtitles and any kind of live transcription of aural speech.
This speech-to-text activity is possible thanks to the work of a professional (the respeaker) who
dictates in real time what he/she hears to speech recognition software which processes the input
received and transcribes it, thus producing a written text.
This dissertation deals with this recent technique which is analysed in relation to simultaneous
interpretation through a comparative analysis of the two professions.
At first we focus on respeaking by looking at its background, the technology used, the target
audience, the skills required to do the job and likely developments in the future. Simultaneous
interpretation is then examined, focusing on almost the same areas.
More specifically, after a first part where the definition and a general description of respeaking
are offered, we move on to the presentation of all the specific characteristics of this technique. In
doing so, respeaking is explored firstly as a “product”, which in most cases are the subtitles. In this
part, the subject of Subtitling for the Deaf and Hard-of-Hearing (SDH) is analysed looking at the
different typologies of subtitles and at how subtitles can be produced and broadcast.
Secondly, we explore respeaking as “function” introducing the subject of social inclusion of
hearing-impaired people. An overview of the international legislation on accessibility is offered,
and more in detail on Web accessibility and TV accessibility.
In the following part an in-depth analysis is dedicated to the “process” of respeaking. One of the
aims of this research is to confirm that the process of respeaking involves a number of mental, non-
automatic activities linked to interpretation. In fact, respeaking is a sort of simultaneous
interpretation in the same language, which requires strong linguistic skills as well as the ability to
understand and analyse complex issues and ideas and to reformulate them in real time. Bearing
these similarities in mind, in the next stage we propose a training module for respeakers that can be
introduced in an academic course for conference interpreters. The rationale of this proposal is that a
specialised interpreter can carry out the activity of live subtitling through respeaking, and thus find
new job opportunities in a sector which is steadily increasing.
The second main purpose of the present work is to prove that an interaction between the two
professionals working in the same communicative event is possible and profitable. To this end, an
7
experimental study was designed and presented in the final part of this work. Two groups of
interpreters were asked to interpret from English to Italian the same text which was presented with
subtitles to one group and without them to the second group. The results of the empirical tests
demonstrate that subtitles created live by the respeaker provide the interpreter with a transcription
of the speech he/she is currently interpreting and have a positive impact on his/her performance.
8
RESUMEN
El tema de este trabajo es el Respeaking, o Rehablado, una nueva técnica que se ha demostrado ser
de extrema utilidad para la producción de subtítulos intralingüísticos en tiempo real y de cualquier
forma de trascripción en directo de un discurso oral. Esta actividad de conversión de voz a texto es
posible gracias al trabajo de un profesional (el respeaker) que dicta en tiempo real lo que escucha a
un software de reconocimiento vocal, el cual procesa el input recibido y lo transcribe,
transformándolo por lo tanto en texto escrito.
El presente trabajo analiza esta reciente técnica en relación a la interpretación simultánea a través de
un análisis comparativo de las dos profesiones.
Primero se analiza el respeaking presentando su historia, la tecnología utilizada, el público de
destino, las habilidades requeridas para llevar a cabo la tarea y los posibles avances futuros. A
continuación se examina la interpretación simultánea, con un enfoque en los mismos aspectos.
Más en particular, después de una primera parte donde se ofrece la definición y la descripción
general del respeaking, se presentan las características específicas de la técnica. Para este fin, se
explora el respeaking como “producto”, que en la mayoría de los casos es el subtítulo. En esta parte
se analiza el tema de la subtitulación para personas sordas o con pérdidas auditivas, presentando los
diferentes tipos de subtítulos y como se pueden producir y proyectar.
En segundo lugar se analiza el respeaking como “función”, introduciendo el tema de la inclusión
social de los discapacitados auditivos en relación a la normativa internacional sobre la accesibilidad,
y más en detalle sobre la accesibilidad Web y la accesibilidad televisiva.
En la parte siguiente se propone un análisis detallado del “proceso” del respeaking. Uno de los
objetivos de esta investigación es aclarar que el proceso del respeaking conlleva unas actividades
mentales, no automáticas, relacionadas con la interpretación simultánea. De hecho el respeaking es
una clase de interpretación simultánea en el mismo idioma, que requiere sólidos conocimientos
lingüísticos junto a la habilidad de comprender y analizar temas y conceptos complejos y
reformularlos en tiempo real. Teniendo en debida cuenta estas semejanzas, se propone a
continuación una unidad didáctica que pueda ser insertada en un curso académico para intérpretes
de conferencia. Se presenta esta propuesta porque se opina que un intérprete especializado podría
llevar a cabo la actividad de subtitulación en directo a través del respeaking, y entonces encontrar
nueva oportunidades laborales en un sector que está creciendo rápidamente.
El segundo objetivo principal del presente trabajo es comprobar que la interacción entre los dos
profesionales que trabajan en la misma situación comunicativa es posible y provechosa. Por lo tanto
9
se ha diseñado el estudio experimental con el que finaliza este trabajo. Dos grupos de intérpretes
han realizado una interpretación simultánea del inglés al italiano del mismo discurso que en un caso
llevaba subtítulos y en el otro no. Los resultados de las pruebas prácticas realizadas demuestran que
los subtítulos producidos en directo por un respeaker pueden ofrecer al intérprete una trascripción
del discurso que está interpretando simultáneamente, mejorando su prestación.
10
INTRODUZIONE
L’oggetto di questa tesi è la nuova tecnica di produzione di sottotitoli in tempo reale nota con il
termine in lingua inglese respeaking ed un confronto di tale tecnica con l’interpretazione
simultanea.
La definizione del respeaking, tradotto in italiano come rispeakeraggio, viene offerta per la
prima volta da Eugeni (2006) in occasione della ‘Prima giornata di studi internazionale sulla
sottotitolazione in tempo reale’, tenutasi nel 2006 nella sede di Forlì dell’Università degli Studi di
Bologna:
Il rispeakeraggio è una recente tecnica tramite la quale un operatore (il rispeaker), mentre
ascolta il testo di partenza, lo ripete, riformula o traduce dettandolo a un software di
riconoscimento del parlato che elabora l’input vocale e lo trasforma in testo scritto.
La decisione di dedicare il presente studio al respeaking nasce dalla convinzione che questa
tecnica per la produzione di sottotitoli in tempo reale possegga molte caratteristiche in comune con
l’interpretazione simultanea.
Si farà notare che il processo traduttivo comune alle due figure professionali, il respeaker e
l’interprete di simultanea, è il risultato di una serie di attività molto simili tra loro. Pertanto, anche la
formazione alle due attività risulta essere composta da alcuni insegnamenti identici, volti a
sviluppare una serie di competenze di base per i professionisti delle due discipline. La caratteristica
che maggiormente accomuna respeaking e interpretazione simultanea è la capacità di compiere più
operazioni simultaneamente, e più nello specifico ascoltare, memorizzare e parlare allo stesso
tempo. Com’è evidente, dunque, la competenza che forse caratterizza più di ogni altra un interprete
di conferenza potrebbe rivelarsi utile per svolgere un nuova professione, quella del respeaker. Si è
pertanto pensato al respeaking come un possibile sbocco professionale per il corso di interpretariato
di conferenza che, completandosi con una serie di esercitazioni volte a sviluppare determinate
competenze aggiuntive, possa aprire nuove porte sul mondo del lavoro ad un neo-laureato del
nostro corso di studi.
Si è inoltre ipotizzata un’altra realtà che renderebbe strettamente collegate le due professioni:
l’influenza reciproca che il prodotto del lavoro di uno dei due professionisti potrebbe avere sulla
prestazione dell’altro. La possibilità che le due figure professionali convivano nello stesso contesto
lavorativo rende possibile che l’interprete si avvalga del testo creato in tempo reale dal respeaker
come supporto scritto a quanto pronunciato dall’oratore, o, vice versa, che il respeaker detti al
software i sottotitoli a partire dalla resa dell’interprete.
11
Entrando maggiormente nel dettaglio, nel primo capitolo si offrirà una descrizione generale del
respeaking e una panoramica sull'attuale grado di diffusione della tecnica del rispeakeraggio per la
produzione di sottotitoli in diretta nella realtà televisiva di alcuni paesi europei, confrontandola con
la situazione italiana. In questo capitolo si introdurranno alcune prime caratteristiche della tecnica
del rispeakeraggio, insieme ad un excursus storico della diffusione che ha avuto negli ultimi anni in
diversi ambiti di applicazione. Si faranno inoltre presenti alcune limitazioni relative alla diffusione
nel panorama italiano e si introdurrà il contributo offerto in materia di sottotitolazione in tempo
reale dall’organizzazione italiana più rappresentativa in difesa dei diritti dei soggetti con disabilità
uditiva, l’Ente Nazionale Sordi.
Nel secondo capitolo si offrirà un excursus sulle caratteristiche precipue della Sottotitolazione
per Sordi o audiolesi (Subtitling for the Deaf or Hard of hearing, SDH) e sulle modalità di
produzione e visualizzazione dei sottotitoli in generale. Verrà presentata la terminologia tecnica dei
vari aspetti della sottotitolazione, tecnica che è ormai a tutti gli effetti una branca autonoma della
traduzione audiovisiva (TAV). Dato l’interesse specifico del presente studio ci si soffermerà sulle
caratteristiche dei sottotitoli intralinguistici per i sordi o audiolesi e si offrirà una presentazione
della componente non verbale della comunicazione.
Al fine di comprendere più a fondo la tecnica del respeaking si presenteranno nel terzo capitolo
alcune caratteristiche tecniche dei programmi che lo rendono possibile, ovvero i software di
riconoscimento del parlato (Automated Speech Recognition, ASR). Si cercherà in questa sezione di
offrire una panoramica sul funzionamento, sulle applicazioni possibili e sulle diverse tipologie dei
programmi ASR e sui possibili sviluppi futuri di questa tecnologia che ha favorito la nascita e il
diffondersi dell’attività del respeaking.
Nel quarto capitolo, partendo dalla considerazione che il pubblico destinatario dei sottotitoli
intralinguistici è costituito in prevalenza dalla comunità dei non udenti e vista la necessità di
conoscerne a fondo le caratteristiche, si cercherà di approfondire il tema dell’accessibilità,
passando poi ad uno studio più approfondito del fenomeno della sordità. Dopo una presentazione in
chiave storica dell’inclusione dei soggetti disabili nella società e la presentazione della relativa
legislazione a tutela di questi soggetti, ci si concentrerà sulle tecniche per rendere accessibili i
contenuti audiovisivi, con un interesse particolare sui mezzi di comunicazione che rappresentano il
canale di diffusione di contenuti in diretta, la televisione e il Web.
Il quinto capitolo è incentrato sull'interpretazione simultanea, attraverso l’analisi della figura
professionale dell’interprete (storia della professione, sviluppi della disciplina, ecc.) vista in
confronto con la figura del respeaker. Si descrivono inoltre le caratteristiche che accomunano
queste due tecniche, mediante una disamina dei contributi teorici che rendono possibile
12
l’inserimento del respeaking nella più ampia branca degli interpreting studies. Proponiamo poi una
sintesi dei modelli didattici più in uso nella formazione degli interpreti simultanei, soffermandoci in
particolare sul modulo didattico elaborato da Lambert (1992). Si dimostrerà che molti insegnamenti
offrirebbero delle solide basi anche per l’attività del rispeakeraggio e ci si concentrerà
maggiormente su alcune attività psico-cognitive che sono alla base di entrambe le attività.
Nel sesto capitolo si proporrà una visione comprensiva di tutte le fasi di lavoro del respeaker e la
competenze necessarie in ognuna di queste fasi. Si presenteranno le conoscenze teoriche e pratiche
utili per il rispeakeraggio che non appartengono anche all’interpretazione simultanea; infine, si
cercherà di individuare un percorso formativo da proporre per la formazione del respeaker che sia il
risultato della disamina realizzata. Nel fare ciò ci si avvarrà delle esistenti linee guida sulla
formazione degli interpreti e della letteratura, tuttavia esigua in materia, per l’individuazione di tutte
le competenze e le relative esercitazioni didattiche per i futuri respeaker.
Il settimo capitolo è dedicato alla fase di ricerca empirica e si baserà sulla descrizione e l’analisi
di un esperimento pratico che possa portare a convalidare le ipotesi sulla possibile interazione tra un
respeaker e un simultaneista. Si offrirà la descrizione dettagliata delle modalità di svolgimento delle
prove empiriche, l’analisi del testo di partenza e del materiale utilizzato per la raccolta dei dati che
ci permetteranno di evidenziare alcuni interessanti risultati riguardo le ipotesi formulate. Si
dimostrerà che l’aspetto prossemico della comunicazione riveste un ruolo fondamentale all’interno
del processo traduttivo svolto dagli interpreti di simultanea e che il testo scritto di quanto percepito
oralmente può rappresentare un valido contributo per la corretta comprensione e restituzione di
specifici elementi testuali del TP. Nel valutare i risultati ottenuti dai candidati all’esperimento si
terrà in debita considerazione la letteratura relativa al tema della qualità in interpretazione (un
aspetto particolarmente controverso della disciplina), e si sottolineerà la caratteristica che rende
innovativo il tipo di ricerca empirica del presente lavoro, ovvero il décalage del testo ‘rispeakerato’.
Questa caratteristica differenzia fortemente la fruibilità di un testo prodotto tramite respeaking dal
normale testo scritto di un discorso di cui un interprete può disporre in cabina.
L’ultimo capitolo è dedicato alla presentazione delle conclusioni in cui si delineeranno delle
considerazioni sul respeaking in visione futura, con alcuni spunti di riflessione per degli ambiti di
ricerca e di applicazione di questa recente tecnica.
Completano il presente lavoro, la bibliografia consultata durante la fase di ricerca e di stesura, la
sitografia e 7 appendici in cui viene presentato il materiale utilizzato per l’esperimento, ovvero la
trascrizione del testo adottato per le prove, la trascrizione dei sottotitoli prodotti dal respeaker del
medesimo testo, i modelli dei due questionari somministrati ai candidati e le trascrizioni delle rese
dei 16 soggetti sottoposti all’esperimento.
13
Con il presente lavoro non si ha la pretesa di aver esaurito l’argomento trattato, sul quale ancora
molto resta da indagare e i cui studi si trovano ancora in una fase pioneristica, ma si vuole offrire un
contributo alla diffusione della ricerca su questo tema ed offrire uno spunto di riflessione per
approfondimenti futuri.
14
CAPITOLO I
RESPEAKING
1.1 Descrizione generale
Il respeaking è una tecnica adottata per la produzione di sottotitoli in tempo reale, tramite la
quale un operatore (il respeaker), mentre ascolta un testo di partenza (TP), lo ripete
simultaneamente ad un software di riconoscimento del parlato che elabora l’input vocale e lo
trasforma in testo scritto. Una volta elaborato dal software, il testo viene reso visibile attraverso dei
sottotitoli che si andranno a sovrapporre all'immagine originale, così da accostare immagini e testo.
È opportuno far presente fin da subito che lo studio sulla tecnica del respeaking è in una fase
pionieristica, e la letteratura scientifica in materia è tuttora esigua. Il corrispettivo termine in lingua
italiana 'rispeakeraggio' viene presentato da Eugeni per la prima volta durante la ‘Prima giornata di
studi internazionale sulla sottotitolazione intralinguistica in tempo reale’ tenutasi a Forlì il 17
novembre 2006, (Eugeni & Mack 2006). Tale giornata di studi è stata organizzata dal Dipartimento
di Studi Interdisciplinari su Traduzione, Lingue e Culture (SITLeC) e la Scuola di Lingue Moderne
per Interpreti e Traduttori (SSLMIT) dell'Università degli Studi di Bologna con l'obiettivo di
affrontare i vari aspetti della sottotitolazione in tempo reale, principalmente mediante il respeaking
e la stenotipia. Questa iniziativa risponde alla sempre crescente attenzione rivolta alla
sottotitolazione in tempo reale da parte del mondo dei media televisivi, delle istituzioni, del mondo
accademico e della comunità dei sordi e audiolesi.
Sebbene la sottotitolazione in diretta possa essere un sussidio per un variegato pubblico di
destinazione, come avremo modo di far notare, la principale ragione della sua diffusione risiede
nell'esigenza di un'efficace e completa inclusione di soggetti con una perdita totale o parziale
dell'udito, ovvero la comunità di soggetti sordi o audiolesi.
La tecnica del respeaking viene già utilizzata in una serie di occasioni in cui sia necessaria la
trascrizione immediata di un discorso presentato sotto forma orale. La maggiore diffusione della
tecnica del rispeakeraggio si riscontra, ad oggi, per la produzione di sottotitoli televisivi in tempo
reale. Va immediatamente sottolineato però che gli ambiti in cui l'estrema utilità, o addirittura la
necessità, di poter usufruire in tempo reale di una trascrizione di contenuti orali sono estremamente
numerosi e includono la creazione di testi scritti per presentazioni e discorsi di conferenze,
congressi, lezioni universitarie e scolastiche in generale, dialoghi di spettacoli teatrali, omelie,
indicazioni nei mezzi di trasporto...
15
L'analisi dei primi passi mossi dal respeaking in Inghilterra, paese in cui maggiormente si ricorre
a tale tecnica, insieme ad una panoramica sull'attuale grado di diffusione della sottotitolazione
televisiva in vari Stati europei, precederà uno studio approfondito sulla situazione italiana.
1.2 Respeaking televisivo
L'utilizzo del respeaking in ambito televisivo risale al 2001, ad opera dell'emittente britannica
BBC. La British Broadcasting Company rappresenta senza dubbio un modello di eccellenza in
termini di produzione di sottotitoli, sia per la quantità di programmi sottotitolati che per la qualità
dei sottotitoli stessi. La nascita del primo dipartimento unicamente destinato alla creazione di
sottotitoli della BBC risale ai primi anni Ottanta, ma era principalmente dedicato alla creazione di
sottotitoli in pre-registrato, ovvero creati in un momento precedente rispetto alla messa in onda del
programma.
Nel giro di pochi anni, però, si cominciarono a sottotitolare un numero limitato di programmi in
diretta e dal 1990 venne creato un reparto di addetti alla sottotitolazione live (appunto, in diretta)
che comprendeva sia sottotitolatori che stenografi (resocontisti di tribunale che utilizzano una
particolare tastiera fonetica, in grado di produrre un testo alla velocità di 250 parole al minuto.
Successivamente il numero di programmi in diretta provvisti di sottotitoli aumentarono
costantemente e dal gennaio del 2001 si cominciò ad utilizzare la tecnica del respeaking. Secondo le
parole dell’attuale responsabile della formazione del respeaking department di RedBee Media (la
società che fornisce il servizio di sottotitolazione alla BBC) le principali motivazioni di tale scelta
furono tre. Innanzitutto la volontà di garantire una maggiore accessibilità dell'intera
programmazione alla comunità dei sordi e audiolesi. In secondo luogo la necessità di rispettare la
legge nazionale che prevedeva il raggiungimento della soglia del 90% delle trasmissioni televisive
sottotitolate per l'anno 2010 (tuttavia la BBC aveva prefissato l'obiettivo di sottotitolare il 100%
della propria programmazione entro il 2008, obiettivo che è stato raggiunto). E infine per una
motivazione di carattere economico, in quanto in precedenza si ricorreva alla stenotipia e l'impiego
di stenotipisti, figure professionali specializzate e di conseguenza altamente remunerate,
comportava dei costi elevati. Per far fronte al grande volume di sottotitoli da realizzare, e in
considerazione dei tempi molto lunghi per la formazione di stenotipisti professionisti, il respeaking
si presentava quindi come una valida alternativa in termini economici alla precedente tecnica della
stenotipia (Marsh 2004).
I primi programmi sottotitolati in diretta tramite respeaking risalgono, come si è detto, al 2001. Si
trattava di eventi sportivi di grande popolarità per il pubblico inglese: il torneo di tennis Wimbledon
16