1.1
Documento digitale:
codifica e i set di caratteri
La seconda metà del secolo scorso rappresentò per l’uomo un periodo
di grande rivoluzione nel campo di una serie di tecnologie elettroni-
che. Una cosa è certa, l’uomo non ha mai smesso di comunicare con il
proprio simile. La scrittura ebbe una forte evoluzione nel tempo, vide
nascere tecnologie in grado di trasformare il nostro modo di concepire
l’informazione, un’informazione capace di arrivare sui nostri calcolatori
o dispositivi palmari, attraverso i documenti digitali. Quando si accenna
al documento digitale, spesso, si fa riferimento ad una fonte di informa-
zione che viene registrata su un supporto materiale. Così, ogni docu-
mento, tende a diventare un contenitore di informazioni
1
.
Apparirà chiaro, che l’informazione e il contenuto corrispondo-
no a due livelli differenti: uno astratto e l’altro materiale (supporto fisico)
che tende a trasmettere l’informazione e conservarla nel tempo. Spesso
succede che il documento viene associato alla pagina stampata, ed è il
caso dei tradizionali supporti: giornali, libri, volantini ecc., eppure, la
composizione dei documenti digitali è differente da quelli tradizionali:
il documento digitale, spesso, oltre a contenere il testo, contiene anche
le immagini, suoni, tabelle ecc. che per essere compresi dal computer,
devono essere rappresentati in maniera chiara.
Se si attenziona bene la parola «digitale», si può osservare che
deriva dall’inglese digit, che significa “cifra”, “numero” ed ecco che si
arriva all’introduzione del concetto della codifica del testo. La codifica del
testo diventa lo strumento necessario per rendere comprensibili al com-
puter le varie informazioni emesse, poiché le uniche entità che esso è in
grado di comprendere e manipolare sono appunto i numeri: lo 0 e 1,
12
che fanno parte della codifica binaria. Maria Teresa di Lupia chiarisce
meglio il concetto e la funzione della codifica binaria:
Assegnando un codice numerico a ciascuna entità testuale, è possibile creare
tabelle di conversione con cui stabilire una corrispondenza fra caratteri e numeri bina-
ri. In questo modo il computer può ricevere informazioni di natura testuale codificata
in forma binaria, elaborarla e restituirla convertita nuovamente nella sua forma di
rappresentazione originale
2
.
Per codificare i caratteri di un testo, si ha bisogno di un codice, rap-
presentato spesso da una tabella in cui ogni carattere corrisponde a un
numero: il nome tecnico che identifica questo tipo di tabella è chiamato
set di caratteri
3
. Per molto tempo il set di caratteri più utilizzato è stato
ASCII
4
(American Standard Code for information Interchange: nato nel 1963).
Questo set è basato sull’alfabeto inglese ed utilizza 7 bit per rappresen-
tare ciascun carattere consentendo la codifica di 128 simboli (27=128)
Ciascuno di questi numeri mostrato nella tabella di esempio
(pag. 14), viene convertito in forma binaria e gestito dal computer. Os-
servando bene la tabella ASCII, si nota chiaramente che presenta dei
limiti nella composizione del testo, in quanto molti dei caratteri non
sono presenti (mancano tutte le lettere accentate, cediglie ecc.). Questa
codifica, infatti, è più adatta ad esempio ai testi scritti in inglese e non è
efficace per altre lingue, soprattutto se non sono alfabeti latini. Per ov-
viare a questo problema, nel tempo sono state apportate delle modifiche
al set, cercando di trovare una minima soluzione nel set ISO 88595
5
(o
ISO Latin 1) che comprende sedici differenti codifiche. Anche questo
set non è sufficiente a codificare i vari caratteri presenti in un docu-
mento perché restano completamente esclusi i sistemi di scrittura come
quelli per il cinese, il giapponese ecc.
Nel tempo si è pensato ad una soluzione diversa, rappresentata
dallo standard Unicode
6
attualmente usato da quasi tutti i computer mo-
derni come set di riferimento. Unicode è una codifica basata sull’uso di
32 bit per rappresentare ogni carattere: ciò significa che è possibile con-
tare su 4 miliardi di codici ampiamente sufficienti a coprire le esigenze
di tutti i sistemi di scrittura oggi in uso
7
. Allo stato attuale, Unicode
è ancora in evoluzione e si predispone alla codifica di tutti i caratteri
rappresentabili. Per quanto concerne alla struttura di Unicode, questa è
basata su un sistema numerico esadecimale (sistema di rappresentazione
13 14
Fig.1. Tabella ASCII e ISO 8859 1
a sedici cifre) ad ogni carattere viene associato un codice che viene rap-
presentato con la sigla U+ seguita da cifre che identificano il carattere.
Unicode presenta però uno svantaggio: ciascun carattere occupa troppo
spazio (32 bit) e i testi codificati con esso, non sono compatibili con le
versioni di set di caratteri citati precedentemente (ASCII e ISO 8859 1).
Per ovviare a questo problema, sono stati creati degli encoding
8
che con-
sentono attraverso, opportune trasformazioni numeriche, di codificare
testi occupando meno spazio. L’encoding oggi maggiormente diffuso
è rappresentato dall’UTF 8, (altre codifiche utilizzate sono UTF 16,
UCS 2 e UCS4) supportato da browser come Internet Explorer, Fire-
fox, Chrome ecc., i software sono la suite Microsoft Office e Open Of-
fice, e i sistemi operativi che lo supportano sono il MacOS, il Windows
e molti altri.
Nonostante questa nota negativa, Unicode presenta dei vantag-
gi rispetto ad altri set di codifica: è in grado di codificare le lingue morte
(per esempio l’alfabeto cuneiforme, fenicio, etrusco ecc.) ma non solo,
anche svariate quantità di simboli: simboli matematici,musicali,chimici
ecc., addirittura l’alfabeto Braille.
15
1.2
Multimedialità, interattività
e ipertestualità
Il computer, come sappiamo negli anni ‘80 divenne il primo protago-
nista della rivoluzione digitale nell’America della fine del XX secolo,
esso portò alla nascita di molti altri apparecchi multimediali e interattivi
che ad un certo punto sembrarono saturare i tradizionali supporti di
trasmissione dell’informazione legati ancora al cartaceo (giornali, libri
ecc.) assorbendoli e confondendone individualità e caratteristiche. Sap-
piamo che i nuovi media del fine secolo furono il cinema, la radio, i
dischi e audiocassette, la televisione e le reti telematiche; furono proprio
questi i presupposti dell’evoluzione dell’informazione nel II millennio,
un periodo storico rivoluzionario che diede vita ad un mercato culturale
e informativo sempre più vasto e differenziato.
L’inizio del XXI secolo rese i nuovi media sempre più multime-
diali e sempre più interattivi, entrambi uniti all’ipertestualità, conside-
rata base necessaria per il trasporto dell’informazione attraverso una
fitta rete di telecomunicazioni. Nel parlare di multimedialià ci si riferi-
sce all’intreccio di diversi codici espressivi (scritto, sonoro, immagini,-
video...) utilizzati in maniera integrata per realizzare un unico oggetto
comunicativo. Un progetto comunicativo diventa multimediale dal mo-
mento in cui è capace di coinvolgere e integrare media differenti, eppu-
re, molto spesso, questi risultano pure interattivi. Per quanto i mezzi di
comunicazione possono sembrare rivoluzionari, non tutti possono ap-
parire interattivi, ma, un oggetto chiamato libro nella sua veste cartacea
può sorprendentemente esserlo. Ma cosa avrà di tanto speciale, potre-
18
mo chiederci, dato che funge da strumento analogico? Gino Roncaglia
ce lo spiega chiaramente nel libro Mondo Digitale:
«gli studi nel campo della semiotica e della critica letteraria hanno spiegato
da tempo che qualunque testo è interattivo in un modo o nell’altro, poiché il libro ha
il potere di modificare il lettore, ma anche viceversa: il lettore può modificare o addirit-
tura creare un libro
9
».
Quando si parla di interattività, ci si riferisce ad un oggetto informativo
che può partecipare ad un processo di comunicazione modificando l’in-
formazione emessa, in base alle scelte dei partecipanti, Gino Roncaglia
spiega:
«Ciò significa che un utente anziché ricevere l’informazione in maniera pas-
siva, è in grado di compiere scelte che influenzano la tipologia ed il contenuto di una
informazione da lui ricevuta: l’utente dispone insomma di un canale di feedback, di
reazione[...]questo canale viene utilizzato per indurre il sistema ad “adattare” l’in-
formazione emessa alle necessità e alle richieste del destinatario.
10
»
Inoltre è importante, per rendere efficace la comunicazione tra il softwa-
re e l’utente, la presenza di un’interfaccia grafica, attraverso la quale l’u-
tente sarà in grado di interagire col sistema e rendere chiare le proprie
preferenze. Un tipo di interattività che dà senso alla multimedialità di
un oggetto comunicativo, è sicuramente l’ipertesto, il quale si compone
di blocchi testuali (chiamati spesso lessie ), e di una serie di collegamenti
e rimandi (links) presenti tra i medesimi blocchi. A volte, però, non si
tratta solo di blocchi di testo, ma anche media come immagini, suoni,
video ecc.
Spesso ci si chiede se, l’ipertesto rispetto al testo normale ha
qualcosa in più e se fornisce davvero qualcosa di nuovo nel campo del-
la scrittura. La grande differenza che vi è nel percorso di lettura tra
un libro tradizionale ed un testo digitale contenente l’ipertesto, è che
quando ci si approccia alla lettura del libro cartaceo, si instaura una
sorta di patto tra lo scrittore ed il lettore, entrambi conoscono le regole
del gioco, e l’autore si aspetta che il lettore segua l’ordine “normale” di
lettura, che legga il libro dall’inizio fino alla fine. È importante precisare
che non sempre un testo è costruito per essere letto linearmente, a volte
può ammettere letture non lineari e una pluralità di percorsi possibi-
19
li. L’ipertesto rappresenta proprio questo: la non linearità di percorsi,
Gino Roncagllia chiarisce: «La non linearità, insomma, è un tratto normalmente
associato agli ipertesti
11
. »
Ciò significa che i blocchi testuali devono essere collegati da una
serie di link, questi, a loro volta, devono prevedere percorsi che l’autore
propone al lettore. Il lettore in questo modo avrà la possibilità di inte-
ragire con l’ipertesto scegliendo egli stesso un percorso di lettura da lui
voluto.
20
Fig.2. Il primo esempio di console per ipertesti elettronici, 1969