7
Altre attività svolte durante lo stage sono state:
ξ Studio generale dei vari componenti di una soluzione “Call Center”
ξ Affiancamento in un progetto di “Contact Center”
ξ Approfondimento della componente “IVR”
ξ Approfondimento delle tecnologie e dei prodotti di riconoscimento
automatico del parlato
ξ Approccio al sistema di documentazione utilizzato nei progetti
ξ Approccio al sistema di test utilizzato nei progetti
8
2 Il contesto tecnologico
2.1 Aziende, telefonia e contatti
Oggi, una qualunque azienda che fornisce servizi o commercializza beni deve
confrontarsi con le seguenti realtà:
ξ l'azienda privata ha sempre più bisogno di aumentare la propria
competitività, incrementando efficacia ed efficienza;
ξ la pubblica amministrazione ha sempre più la necessità di coniugare
l'erogazione di un miglior servizio al cittadino con la razionalizzazione
delle spese, migliorando al contempo la sua immagine;
ξ il livello di qualità delle aziende e della pubblica amministrazione, nonché
del servizio da esse erogato, è reso sempre più misurabile e
confrontabile;
ξ il cittadino/cliente è sempre più consapevole ed esigente.
In tale contesto, caratterizzato anche dall'immediatezza delle comunicazioni, si
fa spazio prepotentemente la tecnologia del Call Center, quale unico sistema con il
quale poter gestire, anziché subire, il cambiamento.
2.1.1 Cos’è un Call Center?
Secondo una definizione di marketing il Call Center è una fabbrica di telefonate,
anzi, una centrale di erogazione di servizi. Secondo una definizione tecnologica
invece: il Call Center è l'elemento di sintesi organizzativa tra le telecomunicazioni e
l'informatica, consentendo il trasferimento sincrono di fonia e dati all'operatore per
l'erogazione di quel particolare servizio che quel particolare cliente sta chiedendo in
quel momento.
Si può inoltre affermare che il Call Center rappresenta il collegamento tra il
cliente e l'azienda pubblica o privata, dove la tecnologia è al servizio
dell’organizzazione, e non viceversa. Il Call Center è pertanto, dal punto di vista del
9
traffico telefonico in ingresso, una via di accesso privilegiata per una qualsiasi
organizzazione oppure, dal punto di vista del traffico telefonico in uscita, un punto di
contatto qualificato che l'organizzazione mette in essere con la clientela.
Oggi si sta assistendo ad una evoluzione del Call Center in Contact Center.
2.1.2 Cos’è un Contact Center?
Un Contact Center è un luogo qualsiasi all’interno di una organizzazione dove
gli impiegati gestiscono il contatto (potenzialmente con qualsiasi mezzo di
comunicazione) con il cliente, sia in ingresso che in uscita, per ottenere o fornire
informazioni o assistenza sulle attività di quella organizzazione. Un Contact Center è
la naturale evoluzione del Call Center in cui vengono gestiti i contatti non solo
comunicando telefonicamente con i clienti, ma gestendo:
ξ telefonate;
ξ messaggi vocali;
ξ fax;
ξ email;
ξ video;
ξ ricerche su internet.
10
2.1.3 Cos’è il CTI?
CTI
(Computer Telephony Integration) è l'unione del mondo telefonico con
quello informatico; è l’integrazione funzionale di:
ξ rete telefonica;
ξ commutazione della voce;
ξ commutazione dei dati;
ξ basi di dati e applicazioni per computer;
ξ analisi della voce;
ξ qualunque altro mezzo di trasporto digitale dell’informazione;
ξ persone: agenti, assistenti tecnici per il cliente ed altri.
2.1.4 L’IVR
Le telefonate in ingresso in un Call Center non vengono generalmente trasferite
immediatamente al primo operatore disponibile, ma, dipendentemente dalla
dimensione della struttura e del numero di servizi offerti dall’azienda, vengono
gestite inizialmente da un sistema di menù a scelta multipla. In questo modo è
possibile gestire le richieste di informazioni più comuni in maniera automatica,
sollevando gli operatori da un notevole carico di lavoro in operazioni noiose e
ripetitive.
Il sistema di menù a scelta multipla è un servizio offerto da applicazioni che
sono in esecuzione su un Interactive Voice Response (chiamato anche Voice
Response Unit): il termine IVR definisce l’hardware e il software in grado di gestire
transazioni telefoniche automatiche. Usando messaggi vocali sintetizzati o
preregistrati il sistema può:
ξ rispondere a chiamate in ingresso;
ξ richiedere informazioni specifiche all’utente;
11
ξ fornire informazioni o servizi in base ai dati forniti dall’utente.
Un esempio può essere il Servizio 12 di Telecom Italia (servizio di ricerca del
numero telefonico di un abbonato).
In un’architettura moderna, le risorse vocali IVR sono definite come operatori
sintetici. In altre parole questo significa che, per il software e/o il middleware
1
di
gestione del Call Center, non esiste alcuna differenza tra operatori umani e sintetici:
entrambi sono considerati soltanto come risorse destinate a un servizio specifico a
cui trasferire in modo sincrono la voce (via doppino telefonico o, in caso di Voice
over IP, via rete locale).
2.2 Riconoscimento della voce
Oggi, le tecnologie di riconoscimento della voce forniscono un’interfaccia
dall’enorme potenziale per accedere ai contenuti informativi, o per navigare in un
menù a scelta multipla, quando l'utilizzo delle mani diventa problematico (ad
esempio in automobile), oppure quando l’informazione da fornire non è solo
numerica. Come è facile intuire, le applicazioni di queste nuove tecnologie sono
innumerevoli, e consentono di superare alcuni problemi, non solo di natura “tecnica”,
altrimenti insormontabili.
Durante l'interazione vocale
2
, il sistema riconosce le richieste del chiamante e
passa le informazioni alle applicazioni per ulteriori analisi.
Le applicazioni che sfruttano le tecnologie di riconoscimento della voce si
dividono essenzialmente nelle tre tipologie riportate nei seguenti paragrafi.
1
Una definizione tecnica di middleware consiste nel considerare come tale tutto il software
indipendente da una particolare applicazione, e che utilizza i servizi base di rete come il TCP-IP.
Insomma nella gerarchia a strati che definisce le reti, il middleware si situa nello strato intermedio
tra quello di TCP-IP e quello delle applicazioni. Da questo punto di vista vanno considerati come
middleware: emulatori di terminali, WWW, Corba ed altri. [BE] 4
2
Il cliente che ha chiamato impartisce comandi o fornisce informazioni usando la voce; il sistema
propone le sue richieste o risponde alle interrogazioni sempre con la voce (preregistrata o
sintetizzata).
12
2.2.1 Riconoscimento vocale
Ognuno di noi produce una voce diversa dalle altre, poiché ha un apparato
fonatorio differente: i suoni vocalizzati hanno frequenze di risonanza particolari
(formanti) che dipendono dal parlatore. Dal confronto di campioni di voce con le pre-
registrazioni e' possibile stabilire, con un certo margine di sicurezza, la paternita' di
una certa registrazione.
2.2.2 Riconoscimento del parlato - ASR
L’acronimo ASR (Automatic Speech Recognition) indica il processo attraverso
cui un software mappa un segnale acustico a un testo. Il primo passo nel
riconoscimento del linguaggio parlato consiste nel campionare la voce filtrandola in
modo da attenuare eventuali rumori di sottofondo. Il secondo passo consiste
nell’individuare i fonemi, operazione ostacolata in alcuni casi da caratteristiche
peculiari di chi parla come il tono di voce o l’accento. Infine, dopo aver compreso i
fonemi, il programma li combina in morfemi
3
e parole.
Le tecnologie di riconoscimento del parlato sono presenti sul mercato da diversi
anni, ma il loro uso è rimasto finora limitato, anche a causa dei numerosi problemi
tecnici che si incontravano durante la fase di riconoscimento della voce. Ottimi
risultati si ottenengono facendo uso di hardware dedicato, in particolare schede DSP
(Digital Signal Processor), con il quale elaborare la voce e alleggerire il carico di
lavoro del processore.
Il riconoscimento del parlato introduce la capacità di relazionarsi con sistemi
automatici telefonici, gli IVR, semplicemente parlando senza avere la necessità di
digitare cifre sulla tastiera del telefono. La voce umana è ancora il modo piu’ naturale
e istintivo per comunicare e avere informazioni, e le applicazioni guidate dalla voce
stanno avendo un enorme successo.
Per lo sviluppo del progetto qui esposto è stata utilizzata la tecnologia ASR.
3
s.m. [pl. -mi] (ling.) ogni elemento che all'interno di una parola serve a indicarne la funzione
grammaticale (p. e. -iamo in andiamo); nella terminologia del distribuzionalismo, ogni unità lingui-
stica minima dotata di significato. (Deriv. del gr. morphé 'forma', sul modello di fonema) [BE] 5
13
2.2.3 Riconoscimento delle frasi - NSR
Il sistema su cui si sviluppano applicazioni di questo tipo riconosce non la
singola parola isolata ma l’intera frase pronunciata, basandosi non solo su parole
chiave, ma anche su algoritmi di interpretazione e interpolazione logica: si parla in
questo caso di Natural Speech Recognition (NSR).
Una volta che il cliente ha fornito la sua risposta, a fronte di un messaggio di
benvenuto del tipo "In cosa posso esserle utile?", vi sono principalmente quattro
tipi di esiti:
ξ il sistema provvede a fornire la risposta in automatico;
ξ la voce sintetizzata riformula la domanda del cliente per verificare la
corretta comprensione, prima di dare la risposta;
ξ nel caso di situazioni di incertezza (ad. esempio il sistema potrebbe
associare la parola "toro" sia al servizio di assicurazione sia all’oroscopo)
il sistema pone al chiamante di scegliere tra le possibili alternative;
ξ se il sistema non è in grado di gestire la risposta inoltra la
comunicazione all’operatore.