5
passando per la pubblicazione di foto, video personali e podcast, fino ad
arrivare alla annotazione di contenuti su del.icio.us.
Proprio l‟annotazione delle risorse della rete, generalmente indicata col
termine di tagging, è una delle tendenze più recenti del Web: l‟utente
fruisce di contenuti ed individua delle parole-chiave, dette appunto tag,
che ne denotino al meglio l‟informazione convogliata. Un meccanismo
tanto immediato quanto utile poiché permette di ovviare ai due limiti
principali del Web: da un lato l‟assenza di una semantica formalmente
definita che descriva il contenuto dell‟informazione presente in Rete
(pensiamo ad esempio alla poca precisione delle ricerche su termini
ambigui, es: pesca, mosca, ecc.), dall‟altro la crescita esponenziale ed
incontrollata dei contenuti presenti su Internet, inquadrata col termine di
Information Overload, sovraccarico cognitivo.
L‟utilizzo dei tag per annotare le risorse, organizzarle ed associare loro
una semantica che ne denoti il contenuto convogliato non è l‟unico e
probabilmente neppure il più efficace tra quelli attualmente esistenti per
eliminare le problematiche legate all‟Information Overload, ma si tratta
senza dubbio di un approccio innovativo, che si presta ad essere
analizzato da vari punti di vista, non ultimo quello della Scienza
dell‟informazione e della Biblioteconomia.
Il contenuto di documenti digitali viene normalmente indicizzato tramite
parole chiavi, e tradizionalmente questa indicizzazione viene fatta da
professionisti per facilitare l'accesso e l‟organizzazione delle informazioni.
Ma quando si ha a che fare con un numero enorme di risorse quali quelle
rese disponibili sui siti internet, che hanno cominciato a generare una
straordinaria quantità di contenuti attraverso wiki e altri strumenti sociali, è
6
molto difficile per dimensioni, costo e tempo, tenere il passo
nell‟indicizzazione.
Quindi l'utilizzo di classificazioni generate dagli utenti, dette folksonomies,
consente agli utenti di organizzare il proprio contenuto digitale, per trovare
gli oggetti di interesse, conservare e mantenere il catalogo utilizzando i
cosiddetti tag, etichette associate alle risorse per indicarne il contenuto.
Il termine folksonomy è un neologismo di origine inglese coniato nel 2004
da Thomas Vander Wal, dall‟unione di “taxonomy” (tassonomia), la
scienza che si occupa dei modi di classificazione di qualsiasi concetto ,
cosa, o essere vivente, seguendo un ordine gerarchico (dal greco: taxis =
ordine, nomos = regole) e “ folk ” (gente)
Il termine è stato quindi utilizzato per indicare in genere una
classificazione spontanea e collaborativa, creata dagli utenti del web che,
assegnando dei tag (etichette), classificano immagini, video, link, testi e
così via.
Si tratta dunque di una forma di tassonomia “inversa” creata da chi la usa
(la gente, “folk”) che, spontaneamente e liberamente, organizza e
“etichetta” le informazioni (pagine web, foto, video, etc.) rese disponibili
attraverso la rete.
Questo sistema di “etichettatura” è stato in genere identificato come una
forma di classificazione e il termine folksonomy, denominata anche “social
tagging”, “collaborative tagging”, “social indexing”, tassonomia popolare,
etnoclassificazione, etc. a seconda all‟aspetto sociale, informativo o
tecnologico del processo che si vuole sottolineare, si è rapidamente
affermato in rete come un sistema di annotazione collaborativa di
informazioni mediante l‟utilizzo di tag scelti liberamente dagli individui che
ne fruiscono.
7
Un aspetto però su cui non si è riflettuto abbastanza in merito a questo
fenomeno è se si tratti effettivamente di una forma di classificazione o
piuttosto di un sistema di indicizzazione delle risorse, dato che l‟attività di
associazione di tag concerne più il concetto di “aboutness” che non quello
del dominio di conoscenze.
Il fatto che fra i termini utilizzati per definire questo fenomeno si sia
affermato proprio il neologismo folksonomy (tradotto in italiano come
“classificazione popolare”) ha infatti portato i non addetti ai lavori a parlare
inconsapevolmente di “tassonomia” e di “classificazione”, utilizzando una
terminologia che appartiene più al mondo dell‟archivistica che non a quello
delle biblioteche. Volendo invece indagare il fenomeno in termini
strettamente biblioteconomici, si rileva come la pratica di attribuzione dei
tag alle risorse in rete sia più vicina ad una forma di indicizzazione, e più
precisamente ad una indicizzazione per soggetto, che non ad una
classificazione.
Si tratta in ogni caso di una indicizzazione basata su termini descrittori del
tutto priva di struttura e di relazioni necessarie tra gli elementi. È una
catalogazione spontanea e collaborativa di risorse eterogenee che si
adatta con facilità ad ambienti di collaborazione libera com‟è la comunità
del web.
Lanciati su vasta scala all‟inizio del 2005 da Technorati
<http://technorati.com>, il principale motore di ricerca dedicato al mondo
dei blog, i tag sono stati sorprendentemente adottati da un gran numero di
siti personali, ancora prima della diffusione di sistemi automatici per la loro
gestione, ma anche di applicazioni internet basate sulle reti sociali quali
Flicr o Youtube, dando avvio a una delle più sorprendenti propagazioni di
“buone pratiche” che la rete abbia conosciuto negli ultimi tempi.
8
Le caratteristiche della folksonomy suggeriscono importanti riflessioni di
ordine sia metodologico che tecnico, oltre a stimolare interessanti
intuizioni sulle dinamiche sociali che prendono vita nel web 2.0, dove il
tagging (l‟applicazione di “etichette” ai contenuti) è “social”, poiché viene
abitualmente affidato agli utenti. Considerato che gli organizzatori
dell'informazione sono di solito gli utenti finali, la folksonomia dovrebbe
produrre risultati che riflettono in maniera più definita l'informazione
secondo il modello concettuale della popolazione che la utilizza.
Sono in molti a pensare che, posto un universo di dati potenzialmente
infinito, quale è oggi la Rete, il miglior disordine possibile consiste nella
buona pratica di “associare delle etichette” alle risorse condivise sul web,
siano esse testi, immagini, indirizzi web o video.
Afferma Sergio Maistrello nel descrivere il fenomeno delle folksonomies
nel suo libro La parte abitata della rete:
“Il ferreo regime di catalogazione che regna tra gli scaffali di una
biblioteca è ordine; la tavola periodica degli elementi chimici è
ordine; la classificazione biologica degli esseri viventi è ordine.
Sono tutti esempi di un ordine oggettivo pre-codificato, che richiede
la condivisione di criteri di interpretazione e il rispetto di precise
sequenze gerarchiche, che si imparano a riconoscere per lo più in
seguito a studi specialistici. La folksonomy, invece, prescindendo
da qualunque schema preordinato, è disordine dotato di una buona
segnaletica.” 1
1
Sergio Maistrello, La parte abitata della Rete, Milano, Tecniche Nuove, 2007,
pag. 84
9
La folksonomy però non è perfetta e viene costantemente migliorata nella
pratica e negli strumenti. Il limite più evidente è dato dall‟ambiguità delle
catalogazioni spontanee (persone differenti classificano in modo differente
le stesse risorse) e dall‟uso di sinonimi, di luoghi comuni passeggeri, di
nomi che possono essere scritti in modi diversi pur essendo riferiti allo
stesso concetto. Quella che dal punto di vista della classificazione può
sembrare causa di entropia in un ambiente per sua natura già caotico, in
realtà non fa altro che riprodurre dentro la Rete una struttura di
organizzazione per analogie molto simile a quella che sta alla base del
ragionamento umano.
Le tecniche per ovviare a questi tipi di problematiche vanno studiate a
fondo per rendere più efficace i sistemi di tagging condiviso. Sul portale
dell‟IstitutoTreccani <www.treccani.it>, ad esempio, si è scelto di proporre
agli utenti un set di termini fra cui scegliere quelli da attribuire alle singole
risorse enciclopediche, parole che rappresentano a loro volta altre risorse,
fino ad ottenere una rete di correlazioni fra termini costruita dai navigatori.
Se comunque accettiamo una visione della rete secondo conversazioni
generate da individui, cosa che già avviene nel web 2.0, la conquista a cui
porta la folksonomy prescinde da tutti i suoi vantaggi e svantaggi
contingenti. Semplicemente bisogna smettere di ricercare un ordine dentro
il web e iniziare ad accettare l‟idea che la rete abbia bisogno di disordine
per funzionare al meglio.
10
CAP. I - I TAG
1.1. Cosa sono e a cosa servono
Il termine inglese tag (propr. “coda”, ma anche “cartellino, contrassegno”),
è usato per indicare diversi concetti. Nel linguaggio jazzistico, ad esempio,
indica una frase musicale (detta anche, con termine francese, queue, cioè
coda) che si aggiunge al ritornello, ma può essere usato anche per
indicare la sigla o la firma stilizzata che identifica l‟autore di un graffito
come vero e proprio contrassegno di identità.
In informatica invece il tag è l‟unità elementare con cui si marcano i campi
di un file (e detta perciò anche marcatore) al fine di poterli identificare e
successivamente processare. Nei linguaggi HTML e XML esistono tag che
identificano singoli elementi della pagina come titolo, autore, un link, etc.
I tag sono quindi dei metadati, dei dati che spiegano altri dati.
La logica di utilizzare “etichette” per identificare porzioni di informazioni si
è rapidamente affermata sul web anche al di fuori dei linguaggi di
programmazione fino ad utilizzare questo termine per intendere in senso
più generale una parola associata ad una risorsa della rete (un'immagine,
una mappa geografica, un post, un video, etc), che descrive l'oggetto
rendendo possibile la classificazione e la ricerca di informazioni basata su
parole chiave.
Bettina Berendt e Christoph Hanser in un articolo dal titolo “Tags are not
metadata, but "just more content" - to some people”2, disegnano una
2
Berendt, Bettina e Hanser, Christoph, Tags are not metadata, but "just more
content" - to some people, International Conference on Weblogs and Social
Media, Boulder, Colorado, USA, 2007
11
particolare tassonomia dei tag, una classificazione gerarchica delle
differenti tipologie di etichette che l‟utente può utilizzare per annotare le
informazioni della Rete. Secondo questo studio, i tag possono essere
suddivisi in cinque diverse categorie:
1. Content-Based Tag – si tratta dei tag che indicano il contenuto
dell‟oggetto o delle categorie cui l‟oggetto appartiene (es. Auto,
Ferrari, ecc.)
2. Context-Based Tags – forniscono informazioni legate al contesto
dell‟annotazione (es. vacanze Natale, Agosto, ecc.)
3. Attribute Tags – caratteristiche dell‟oggetto che non sono
direttamente derivate dalla categoria cui appartiene (es. la mia
macchina)
4. Subjective Tags – tag soggettivi, che esprimono impressioni
personali ed emozioni sull‟annotazione effettuata (es. bello,
interessante)
5. Organizational Tags - tag che esprimono annotazioni personali,
slegate però dall‟aspetto emotivo (es. da leggere)
I tag, che in genere vengono scelti direttamente dagli autori/creatori
dell'oggetto dell'indicizzazione in base a criteri del tutto informali, sono
stati presto associati al concetto di web 2.0 e ai cosiddetti servizi di social
bookmarking.
I tag sono uno strumento del web 2.0 perché consentono a chi pubblica
una risorsa di etichettarla ("taggarlo" in slang 2.0) con una o più parole che
ne definiscano e ne facciano capire il contenuto ed il senso.
Sono qualcosa di più quindi delle parole chiave, keywords, perché non
vengono estrapolati automaticamente dal testo, dal titolo o dalla
http://www.icwsm.org/papers/2--Berendt-Hanser.pdf
12
descrizione del contenuto ma assegnate direttamente o da colui che l'ha
pubblicato e che per primo è in grado di descriverne il significato o da chi
fruisce di quel contenuto.
L‟uso dei tag infatti è molto intuitivo: ogni unità di contenuto immessa in
circolo può essere integrata con alcune meta-informazioni semantiche che
ne specificano i temi impliciti ed espliciti, il contesto e tutto quanto può
essere utile per archiviarla nella grande rete e favorirne il reperimento da
parte delle persone interessate.
Se nel caso delle parole chiave siamo di fronte ad una ricerca
automatizzata, qui c'è un prezioso intervento umano che assegna un
senso ad un contenuto. Il vantaggio per chi cerca qualcosa attraverso i tag
è di avere la possibilità di provare ad effettuare ricerche semantiche
formate quindi anche da insiemi di parole e basate sul senso della frase,
non solo sul significante ma anche sul significato della stessa.
Molti studiosi considerano i tag come veri e propri metadati, perché
descrivono, classificano, organizzano altri dati.
Un metadato infatti è un tipo di informazione che descrive un insieme di
dati, necessario per ricercare i dati, rappresentarli e utile a comprenderli.
Bettina Berendt e Christoph Hanser, invece, nel loro già citato contributo
alla International Conference on Weblogs and Social Media scrivono:
In a corpus of posts consisting of body elements (text, title, ...) and
author tags, the tags are not metadata but content if the tags have
a low similarity with the body (such that body features cannot be
used to predict the tags, or vice versa), and the combination of body
and tags predicts the human consensus classification3.
3
ibidem