10
In genere, in questo ambito, esistono già proposte di soluzioni per l’accesso alle
matematiche che, sebbene rappresentino delle grandi promesse, risultano spesso
inaffidabili.
Tra queste soluzioni ci sono alcuni sistemi che utilizzano il Braille. Un loro impiego
nelle università italiane risulta improponibile proprio per i problemi di mancanza di
standard di cui si è detto prima.
Per queste ragioni, nel progetto di un ausilio per accedere alla notazione
matematica, il primo importante passo da fare è stabilire degli standard di
comunicazione. In base a questi standard, vi potranno essere soluzioni al problema
che differiranno in base al percorso di analisi seguito.
Con il presente lavoro si propone di realizzare una piattaforma per l’accesso
alla matematica che comporti i minori cambiamenti possibili nella configurazione
hardware e software esistente in dotazione al disabile. In tal modo verrà fornito uno
strumento di utilizzo immediato che non sconvolge le conoscenze e le abitudini del
videoleso.
Avendo rilevato che la maggior parte dei videolesi utilizza un PC con screen reader,
l’output principale della piattaforma è di tipo audio.
Viene stabilito, inoltre, uno standard di scrittura dei documenti che, per la
semplicità di utilizzo degli strumenti suggeriti, non va a variare di molto il modus
operandi di chi scrive.
11
3.1.1 introduzione ad ausili e disabilità
3.1.1.1 disabilità
In base ad una classificazione messa a punto dall’Organizzazione Mondiale
della Sanità si adottano le seguenti definizioni:
- menomazione: qualsiasi perdita o anormalità di una struttura o di una
funzione psicologica, fisiologica o anatomica;
- disabilità: stato che si manifesta quando la menomazione porta all’incapacità
di compiere un’attività nel modo o al livello considerato normale per un
essere umano;
- handicap: stato in cui, a causa di menomazioni o disabilità, una persona
incontra difficoltà nell’adempiere al ruolo normale che la società si aspetta.
Ne scaturisce, quindi, che la menomazione è riferita a corpo e mente, la disabilità è
riferita alla persona mentre l’handicap è un concetto sostanzialmente sociale.
Un ausilio esiste in risposta a determinati bisogni dettati dalla disabilità.
L’assistenza, l’integrazione sociale e i diritti dei disabili sono
regolamentate da leggi dello Stato italiano, in particolare dalla legge n.
104 del 5 febbraio 1992. Qui si ritrova una definizione di persona
handicappata:
“È persona handicappata colui che presenta una minorazione fisica, psichica o
sensoriale, stabilizzata o progressiva, che è causa di difficoltà di apprendimento, di
relazione o di integrazione lavorativa e tale da determinare un processo di
svantaggio sociale o di emarginazione”.
Scorrendo i vari articoli della legge si capisce come questa sia intesa nel rispetto
della dignità umana e dei diritti di libertà ed autonomia del soggetto, aspetti che si
vuole garantire promuovendo la ricerca scientifica, genetica, biomedica ,ecc.. al fine
della rimozione delle cause invalidanti. La legge garantisce all’handicappato, ed alla
sua famiglia, un sostegno psicologico adeguato, servizi di aiuto e sussidi tecnici.
Riguardo all’integrazione scolastica, fra le varie soluzioni possibili viene presentata
quella di dotare scuole ed università di attrezzature tecniche e sussidi didattici.
12
Proprio in questo campo la legge 104 ha subito integrazioni e modifiche mediante la
legge n. 17 del 28 gennaio 1999 in cui si sancisce che “agli studenti handicappati
iscritti all’università sono garantiti sussidi tecnici e didattici specifici…”. Ancora,
la legge indica che “le università, con proprie disposizioni, istituiscono un docente
delegato dal rettore con funzioni di coordinamento, monitoraggio e supporto di
tutte le iniziative concernenti l’integrazione nell’ambito dell’ateneo”.
È seguendo lo spirito della legge 17 che è stata istituita nell’Università Federico II
una Commissione di coordinamento per le attività di supporto per gli studenti con
disabilità, nelle cui funzioni si inserisce il presente lavoro di tesi, intenso come
sussidio per lo studio delle materie tecnico- scientifiche.
Le attività di sostegno portate avanti dalla Commissione tendono a ridurre le
situazioni di handicap per gli studenti svantaggiati a causa di disabilità di vario
grado: visive, motorie, uditive e malattie croniche. La Commissione ha, in
particolare, il compito di coordinare gli interventi per:
- predisposizione di attrezzature tecniche e sussidi didattici idonei ad ogni
particolare disabile;
- programmazione di interventi individualmente adeguati;
- diversificazione degli ausili necessari a seconda della tipologia della
disabilità;
- concessione di esonero totale o parziale dalle tasse di iscrizione e di
contributi universitari, per il caso di determinate condizioni;
- attivare il Centro di Orientamento Didattico Educativo (nel caso esistano
problemi relativi alla didattica);
- attivare il Centro di Counselling Psicologico.
3.1.1.2 ausili
La realizzazione di una piattaforma matematica acquisisce carattere di ausilio
se è uno strumento in grado di aiutare un videoleso nell’affrontare i problemi di
13
carattere matematico e, in genere scientifico, che fanno parte non solo del bagaglio
tecnico professionale ma anche del mondo del lavoro.
Un ausilio è una apparecchiatura, un’attrezzatura o un accorgimento che consente
alla persona disabile di attivare o di potenziare un percorso di autonomia che rispetti
le proprie esigenze e possibilità e quelle dell’ambiente che lo circonda.
Un ausilio tecnico è un prodotto, uno strumento o un sistema tecnologico
specializzato o di comune commercio che viene utilizzato dal disabile per prevenire,
compensare, alleviare o eliminare la sua disabilità. Le attrezzature che hanno
finalità di tipo clinico non sono considerate ausili.
Un ausilio può essere costituito da uno o più dispositivi in modo che il
sistema nel suo complesso presenti degli ingressi adattati, detti interfaccia di input,
ed uscite, anch’esse adattate, dette interfaccia di output. L’adattamento delle
interfacce viene fatto in modo da utilizzare al meglio le potenzialità residue del
disabile a cui si rivolge l’ausilio.
Siccome le disabilità si presentano sotto una gamma pressoché infinita di
quadri funzionali, non esistono soluzioni standard di ausilio che, anzi, vanno quasi
sempre personalizzate. La personalizzazione può essere fatta attraverso la modifica
fisica dell’ausilio, in un particolare modo d’uso o di posizionamento, di interazione
con un dato software, ecc..
In parallelo al concetto di ausilio va considerato il concetto di accessibilità
inteso come la progettazione dell’ambiente, dei prodotti e dei servizi in modo che
possano essere fruiti agevolmente da persone con disabilità.
3.1.1.3 ausili elettronici ed informatici – l’informazione in formato elettronico
In questo lavoro l’attenzione è rivolta agli ausili che permettono l’accesso al
calcolatore elettronico, in particolare, ad applicazioni matematiche e scientifiche in
genere. L’informazione in formato elettronico presenta molti vantaggi tra i quali il
non trascurabile aspetto della flessibilità che si evidenzia sia attraverso la capacità
di elaborazione sia attraverso la possibilità di assumere diverse forme di output.
14
Questo aspetto, legato a diverse possibilità di input, mostra come il personal
computer e le informazioni elettroniche rappresentino un potente ausilio e
costituiscono lo strumento che più di tutti consente possibilità di integrazione,
adattamento e svolgimento di attività altrimenti proibite.
I dispositivi di input sono periferiche hardware ed interfacce software; i
dispositivi di output sono strumenti analoghi ai precedenti usati per la lettura dei
dati. Tali dispositivi possono rappresentare una barriera tecnologica verso l’uso del
calcolatore. Basti pensare alla periferica di output principe, cioè il monitor. Ci sono
persone ipovedenti che non possono utilizzarlo a pieno e persone cieche che,
invece, non possono utilizzarlo affatto. Queste persone devono utilizzare ausili
appositamente progettati che esaltino la capacità sensoriali residue, cioè il tatto e
l’udito. In tale modo l’informazione elettronica, che non si rivolge ad una tipologia
particolare di utente, è resa disponibile anche per i ciechi.
3.1.1.4 disabilità della vista
La disabilità visiva comprende due classi di utenti:
- ciechi;
- ipovedenti.
In base a questa distinzione cambiano le modalità di accesso all’elaboratore perché
l’accesso si fonda su quelli che sono i residui sensoriali: gli ipovedenti possono, in
genere, utilizzare il monitor come dispositivo di uscita, anche se mediante
accorgimenti quali aumento della dimensione del font utilizzato, utilizzo di software
di ingrandimento, impostazione di colori che migliorino il contrasto della
presentazione a video; gli utenti ciechi devono, invece, utilizzare dispositivi di
uscita differenti quali il display Braille, per ottenere una uscita tattile, o un
sintetizzatore vocale, per ottenere una uscita audio.
In entrambi i casi l’informazione va ristrutturata in modo da permetterne l’accesso.
In generale, l’informazione assumerà l’aspetto di righe di testo opportunamente
formattate.
15
3.1.2 ausili per disabili della vista
Di seguito, si riporta una breve descrizione dei principali ausili elettronici per
disabili visivi attualmente in commercio.
3.1.2.1 ausili per non vedenti
Gli ausili rivolti ai non vedenti possono essere utilizzati con efficacia anche
da ipovedenti. Questi sono display Braille, screen reader, stampanti Braille, sistemi
OCR ed altri apparecchi che vengono descritti brevemente di seguito.
3.1.2.1.1 display braille
Il display Braille, applicato ad un qualsiasi computer di solito attraverso una
porta seriale, permette di trasformare il contenuto di una riga del monitor in un testo
Braille in rilievo. I comuni display Braille presentano 40 celle, come per i normali
testi Braille su carta. Ogni cella è formata da una matrice di otto punti che, grazie a
trasduttori piezoelettrici si alzano e si abbassano a seconda del corrispondente
carattere a video da rappresentare. La videata è esplorata a gruppi di 40 caratteri
grazie ad un’apposita interfaccia software di cattura dello schermo.
Alcuni display Braille si incastrano sotto la tastiera standard; alcuni dispongono di
tasti per operazioni speciali quali lo scorrimento di tutta la videata, scansione del
video per parole intere, immissione di tabulazioni, ricerca di stringhe, conoscenza
delle coordinate del cursore, conoscenza del colore delle scritte.
3.1.2.1.2 sintesi vocale
Il sistema di sintesi vocale è composto da scheda audio, amplificatore,
diffusori acustici e da un software che definisce le regole di pronuncia. Si tratta di
sistemi integrati a software di tipo screen reader per i quali quanto appare sullo
schermo potrà essere ascoltato dall’utente non vedente. In verità, gli screen reader
hanno al possibilità di dirigere l’output anche verso un display Braille, ma in questo
caso, l’attenzione è rivolta all’uscita audio. Il testo a video può essere letto in
diversi modi: lettura di singoli caratteri o parola per parola, riga per riga, lettura
16
continua e scorrevole, lettura con punteggiatura, con indicazioni degli attributi del
testo, cioè maiuscole, corsivi, punteggiature, lettura con spelling, ecc..
3.1.2.1.3 stampanti braille
Le stampanti Braille sono stampanti che consentono la stampa in rilievo, su
supporto cartaceo, di un qualsiasi codice ASCII. I vari modelli in commercio si
differenziano per velocità di stampa ed eventuale possibilità di stampare su ambo i
lati del foglio senza che i due testi interferiscano (stampa interpunto). La possibilità
di stampa interpunto è importante in quanto dimezza il peso della carta usata.
3.1.2.1.4 scanner ed ocr
Usando uno scanner può essere catturata una immagine grafica per
trasformarla in una informazione digitale. Grazie ai programmi OCR, i caratteri del
testo stampato su carta vengono riconosciuti ottenendo un testo in formato
elettronico, in modo da poter eseguire un salvataggio su memoria di massa, una
stampa in Braille, una lettura attraverso display Braille o tramite sintesi vocale.
Sebbene scanner ed OCR siano prodotti di uso generale, esistono programmi di
OCR progettati appositamente per essere utilizzati da non vedenti. Questi sono in
grado di decodificare il testo anche se il foglio non è stato posizionato
correttamente, se la scrittura è articolata in colonne, titoli, paragrafi e se vi sono
disegni, fotografie e tabelle.
Esistono, ancora, scanner con OCR incorporati a sintetizzatori vocali che
permettono la lettura istantanea del testo. Si tratta di apparecchi che non hanno
bisogno di interfacciarsi ad un PC.
17
3.1.2.1.5 apparecchi portatili
Si tratta di apparecchi di piccole dimensioni alimentati a batterie che
permettono di scrivere, memorizzare e leggere testo. L’immissione del testo avviene
attraverso una tastiera Braille ad 8 tasti più i tasti di controllo. La lettura avviene o
mediante sintesi vocale o attraverso display Braille.
C’è, poi, l’Optacon, uno strumento composto da una piccola telecamera e da
una superficie in grado di riprodurre in rilievo ogni forma che viene ripresa dalla
telecamera.
3.1.2.2 ausili per ipovedenti
Gli ausili rivolti agli ipovedenti sono essenzialmente degli ingranditori di
immagine, come è descritto di seguito.
3.1.2.2.1 videoingranditori
I videoingranditori sono apparecchi con un sistema di telecamera a circuito
chiuso che riprendono una immagine e la ripropongono, ingrandita, su di un video.
Tali apparecchi consentono la modifica del grado di ingrandimento e l’impostazione
di diversi tipi di contrasto. Siccome ingrandendo l’immagine viene ridotto il campo
visivo, l’utente che vuole leggere il testo oltre la finestra visualizzata deve spostare
il testo sotto l’obiettivo. Questa operazione si compie facilmente grazie ad un
carrello a scorrimento posto su una slitta sotto l’obiettivo della telecamera.
3.1.2.2.2 programmi di zoom per computer
I programmi di zoom sono applicazioni software che, aumentando le
dimensioni dei caratteri sullo schermo, permettono l’uso del calcolatore a persone
con gravi deficit visivi. Non richiedono di funzionare associati ad apparecchiature
particolari, possono essere installati su qualsiasi computer e funzionare in
combinazione con altri programmi.
18
L’ingrandimento causa una riduzione dell’area di schermo visualizzata. Utilizzando
mouse o controlli da tastiera, però, si può selezionare l’area da visualizzare.
Esistono sistemi a schermo diviso, che si usano con un PC, in cui attraverso un
sistema televisivo a circuito chiuso in metà schermo compare il testo stampato
ingrandito e, nell’altra metà, compare il testo che si sta digitando. Questo aiuta
l’ipovedente ad effettuare il suo lavoro di digitazione senza mai distogliere lo
sguardo dal monitor.
3.1.3 introduzione alla sintesi vocale
Ai primordi della sintesi vocale con elaboratore, anni settanta, i calcolatori
erano in grado di leggere un testo scritto in diverse lingue ma non di sostenere una
comunicazione uomo - macchina nella quale fosse possibile rivolgere verbalmente
delle domande all’elaboratore, ottenendo risposte sensate e coerenti alle domande
poste.
L’ostacolo principale è costituito dal fatto che l'elaboratore è una macchina
sintattica e non semantica. Cioè, un computer elabora informazioni secondo precise
regole sintattiche, ma non è in grado di attribuire un significato ai simboli cioè non
introduce un concetto semantico.
Affinché un elaboratore sia in grado di sostenere una comunicazione con un uomo è
necessario che sia in grado non solo di ricevere un segnale vocale ma anche di
capirlo. Questo obiettivo è difficile da raggiungere soprattutto se si pensa alle
molteplici sfumature che si possono dare ad una frase.
Per consentire ad un elaboratore di parlare, storicamente sono state seguite
due strade:
- la creazione di un modello del parlato umano che tiene conto delle diverse
attività cerebrali e muscolari che portano alla vocalizzazione e alla
costruzione di frasi di senso compiuto, processo noto come sintesi
articolatoria;
19
- l'utilizzo di piccoli frammenti di parlato umano che, opportunamente
combinati, consentono di esprimere qualunque concetto, processo noto come
sintesi per formanti.
Questi due approcci sono utilizzati ancora oggi e, non essendo esclusivi, si
combinano in vari modi.
3.1.3.1 la sintesi articolatoria
La comunicazione tra un essere umano ed un elaboratore, sarebbe possibile
costruendo dei modelli del parlato umano che, tramite un insieme di regole,
consentissero ad un calcolatore di esprimere qualunque frase. Quanto più il modello
fosse rappresentativo del parlato umano, tanto più si riuscirebbe a ricreare un
parlato dal timbro naturale. Questo richiede competenze di vari settori quali la
fonetica, la linguistica, l’acustica, l’elettronica e l’informatica.
I ricercatori del settore hanno dedicato molti studi ai modelli della sintesi
articolatoria, focalizzando l’attenzione su sintassi, lessico e vocalizzazione. Questi
modelli tengono conto di come i vari organi del canale vocale umano producono dei
suoni articolati tralasciando, però, tutti gli aspetti riguardanti le attività cerebrali che
portano dal concetto alla costruzione di una frase, cioè la rappresentazione
concettuale e semantica.
L'insieme di regole da costruire per la sintesi articolatoria è complesso, ma
richiede poche risorse di memoria. Per questo motivo, dato che in passato la
memoria era una risorsa scarsa, all'inizio si è lavorato molto sui modelli di sintesi
articolatoria. Nonostante lo scarso impiego di memoria, però, la sintesi articolatoria
richiede una notevole capacità di elaborazione. Per questo motivo l'utilizzo di tali
modelli era comunque limitato solo a computer da laboratorio.
20
3.1.3.2 la sintesi per formanti
La sintesi per formanti è una variante della sintesi articolatoria: il modello si
riferisce alle caratteristiche acustiche del canale vocale in termini di risonanze e
antirisonanze. Per simulare le caratteristiche acustiche del canale vocale umano,
vengono usati dei generatori di suono che possono essere:
- generatori di segnale impulsivo periodico che vanno bene per le vocali;
- generatori di segnale casuale, rumore bianco, che vanno bene per le
consonanti.
Lo spettro dei diversi suoni della voce umana viene simulato mediante
combinazioni in serie e in parallelo di risuonatori accordati su specifiche frequenza
chiamate formanti.
Nel modello della sintesi per formanti vi sono opportune regole che descrivono:
- le posizioni delle formanti nei diversi fonemi della voce umana;
- le variazioni delle formanti nel passaggio da un fonema all'altro (co-
articolazione).
Le regole di sintesi, che descrivono le variazioni delle formanti nel passaggio tra un
fonema e l'altro, tengono conto del fatto che il suono della voce umana può anche
essere funzione del suono che verrà prodotto successivamente. La pronuncia di un
singolo fonema dipende, quindi, da molti fattori quali:
- pronuncia del fonema precedente e del fonema successivo;
- l'intera parola;
- la posizione della parola nella frase;
- il tipo di frase;
- il significato assunto dalla frase in un determinato contesto.
Nel modello della sintesi per formanti è necessario costruire i fonemi attraverso i
quali un elaboratore possa parlare. I fonemi vengono costruiti come segue:
- si registrano frammenti di voce umana della durata di alcuni secondi;
- ogni frammento viene suddiviso in intervalli della durata di l0 o 20 ms in
modo che il segnale vocale possa ritenersi statisticamente stazionario in tale
intervallo di tempo;
21
- in ognuno di questi intervalli si calcola l’autocorrelazione tra i campioni del
segnale vocale. Per la stazionarietà, tale autocorrelazione è approssimata
dalla media;
- usando i valori di autocorrelazione calcolati in precedenza, si costruiscono
delle matrici di autocorrelazione;
- tramite le matrici di autocorrelazione si calcolano i coefficienti di filtri
predittori lineari. Tali filtri saranno di ordine almeno pari a 10.
A questo punto, sollecitando il sistema di filtri in serie e in parallelo con un
generatore di segnale impulsivo periodico per i suoni vocalizzati o con un
generatore di segnale casuale per i suoni non vocalizzati, ogni filtro predittore
ricostruisce un fonema.
In questa procedura il problema fondamentale è quello di suddividere i frammenti di
voce umana in intervalli di tempo adeguati in modo da troncare il frammento di
voce in un punto adatto all’estrazione di un determinato suono. Solitamente, il
troncamento viene effettuato in un punto in cui il segnale vocale è caratterizzato da
bassa energia ed energia costante (che si verifica a metà, circa, di una vocale). In
questo modo, una volta ricomposto il segnale vocale, l'orecchio umano non
percepisce alcuna discontinuità.
Un altro aspetto importante è la scelta dei frammenti di voce umana. Questi devono
essere neutri, cioè senza particolari enfasi, per essere adatti alla ricomposizione
finalizzata alla lettura di testi.
Il processo di registrazione di frammenti di voce umana e la successiva
suddivisione in opportuni intervalli temporali è un processo lungo che impone un
limite al numero di frammenti che si possono memorizzare. Inoltre, la
conformazione dell’apparato vocale umano dà origine a moltissimi suoni per cui gli
studiosi del settore si sono accordati per classificare un numero limitato di fonemi
che potessero rappresentare, più o meno bene, tutti i fonemi.
D'altro canto, la voce umana non è una semplice sequenza di fonemi, ma un
continuo di fonemi e di transizioni da un fonema al successivo per cui risulta
necessario catturare anche le transizioni tra un fonema e l'altro. A tale scopo sono
22
stati introdotti i difoni, cioè le concatenazioni tra la seconda parte di un fonema e la
prima parte di quello successivo.
La limitazione sul numero di fonemi utilizzati conferisce alla sintesi una buona
intelligibilità, ma conserva un timbro marcatamente metallico dovuto al fatto che la
frase pronunciata difetta in diversi punti, cioè
- manca la giusta distribuzione dei toni;
- manca un'adeguata collocazione delle pause;
- le durate di suoni e pause non sono corrette.
In altri termini, la prosodia, cioè il modo in cui la frase viene pronunciata, è
imperfetta.
Per migliorare la prosodia si potrebbe procedere in due modi:
- utilizzare modelli più sofisticati che tengano conto del modo in cui una frase
viene formata e vocalizzata a partire dai concetti che si vogliono esprimere
con la frase;
- utilizzare un maggior numero di difoni.
Il secondo modo è più utilizzato in quanto è quello più facilmente e realizzabile.
3.1.3.3 screen reader
Legati alla sintesi vocale vi sono programmi detti screen reader o lettori di
schermo che producono la sintesi vocale del testo scritto sullo schermo di un
computer e presentazione tattile su display Braille. La sintesi viene ottenuta
convertendo in codice ASCII tutto quello che compare sullo schermo e mandando
questo codice verso il dispositivo di uscita che può essere un sistema audio o un
display Braille.
Se un non vedente fa uso di file di testo, o di programmi che producono file di testo,
lo screen reader è in grado di leggere correttamente ciò che appare sullo schermo.
Questo evidenzia come gli screen reader lavorino bene praticamente solo su forme
di testo lineari, cioè disposte su righe successive.
23
Quando, in passato, il sistema operativo standard era il DOS, tutto l’ambiente era di
tipo testo e gli screen reader non mostravano problemi di funzionamento. Con
l’avvento delle interfacce grafiche, caratteristiche dei sistemi Windows, si sono
evidenziate le limitazioni che hanno gli screen reader ad interagire con immagini.
3.1.4 accessibilità
E’ importante porsi fin dal principio il problema dell’accessibilità in modo da
evitare l’esclusione dei disabili dall’uso di prodotti e tecnologie tenendo presente
che possono nascere problemi al livello dell’interfaccia sistema – utente, ed anche
che in certi casi è sbagliato l’approccio di insegnamento all’uso di tecnologie (IMS
Global Learning Consortium).
L’introduzione degli editor di testo, nel suo complesso, ha migliorato la vita degli
utenti nel senso che errori quali omissioni o errori in parole o frasi non costringono
alla riscrittura dell’intera pagina. L’utente può cambiare a suo piacere stile e
formattazione, controllare l’ortografia o sostituire dei sinonimi col un solo click. Da
questo si intuisce come l’accesso al mondo del lavoro è facilitato per coloro che
sanno muovesi in questo “ambiente elettronico”.
Software accessibile per utenti ciechi.
Per evitare di realizzare programmi per ciechi poco accessibili, si deve tener
presente che questi verranno utilizzati con screen reader. Bisogna tenere conto di
come funzionano questi ultimi. In particolare vanno utilizzate poche immagini,
ognuna delle quali deve contenere una didascalia o un’etichetta a cui si potrà
associare la sintesi vocale, le barre degli strumenti devono essere essenziali e senza
ridondanze. In genere l’accessibilità aumenta quando
- documentazione e guida in linea sono progettati per essere capiti mediante la
sola lettura del testo;
- descrizioni audio e sincronizzazioni appaiono come un film o comunque
come un grafico animato;