8
sotto il profilo promozionale, un’indicizzazione sensata e
razionale dei siti, insieme alla nascita di sistemi come Adwords2
e Adsense3 hanno dato concreti saggi del potere della visibilità,
che ha incominciato a fare gola a tutti.
In un Web 2.04 che ha ulteriormente acuito la tendenza social
già preannunciata nel primo boom della Rete, gli addetti ai
lavori (e non solo loro) si sono mossi immediatamente, per
cogliere le opportunità economiche derivanti da questa
transizione. Da un lato, le aziende hanno intuito l’importanza
dell’essere presenti online con una posizione di preminenza
rispetto ai concorrenti. Dall’altro, i motori di ricerca hanno
fornito la struttura per pianificare l’ingresso in Internet a
tavolino, programmando investimenti e risultati. In mezzo, tante
società di consulenza che si premurano di implementare le
strategie dei propri clienti sui motori.
Come spesso accade, la corsa all’oro ha portato ad eccessi ed
esagerazioni. Chi richiede una campagna di Web marketing,
spesso ignorandone gli strumenti operativi, pretende risultati
immediati ed improbabili. D’altro canto, sul Web sono spuntate
come funghi le società che si occupano di SEO, Search Engine
Optimization. Alcune sono molto serie e ottengono risultati
credibili e persistenti. Ma molte altre promettono la luna,
2
AdWords è il servizio che Google offre agli inserzionisti per inserire il proprio sito all'interno dei risultati di ricerca, in
uno speciale spazio dedicato dal nome “collegamenti sponsorizzati”. Il servizio non è gratuito, ha un costo per click,
stabilito in precedenza dall'inserzionista, che viene scalato dal budget a disposizione ogni volta che un utente clicca
sull'annuncio (pay-per-click). Tra le varie possibilità di personalizzazione degli annunci, particolarmente interessante
per questa ricerca risulta quella di scegliere le parole chiave per la visualizzazione dell'annuncio
(http://it.wikipedia.org/wiki/Google#AdWords)
3
AdSense è il canale pubblicitario di Google che permette di guadagnare con il proprio sito. È un algoritmo che
scansiona in automatico il contenuto delle pagine Web e pubblica in una sezione dedicata gli annunci più pertinenti al
sito. La remunerazione è basata principalmente sul sistema del pay-per-click: Google paga qualche centesimo di dollaro
ogni volta che un utente clicca sull'annuncio AdSense (http://it.wikipedia.org/wiki/Google#AdSense)
4 Il Web 2.0, secondo una definizione comune e semplificatoria, differisce dal concetto iniziale di Web,
retroattivamente etichettato Web 1.0, perché si discosta dai classici siti web statici, dall'e-mail, dall'uso dei motori di
ricerca, dalla navigazione lineare e teorizza una rete più dinamica e interattiva. Esempi di tale dinamicità sono dati dal
social commerce - l'evoluzione dell'E-Commerce in senso interattivo – e dai social network, che consentono una
maggiore partecipazione degli utenti attraverso blog, forum, sistemi di feedback ecc. (it.wikipedia.org/wiki/Web_2.0)
9
operano con metodi discutibili (passibili di penalità da parte del
motore di ricerca) e in generale non portano a concreti
miglioramenti in termini di visibilità.
L’unico modo a nostra disposizione per districarci in questa
spirale speculativa, consiste nel conoscere e studiare
approfonditamente i meccanismi interni che regolano il
funzionamento di un motore di ricerca. Questo significa, nello
specifico, comprendere le logiche e le dinamiche proprie
dell’Information Retrieval5 e applicarle al contesto dei motori di
ricerca: in breve, determinare quali sono gli elementi chiave nel
processo di ricerca e indicizzazione delle pagine Web, in che
modo sono tra di loro interconnessi e tali conoscenze possano
essere utili per ottenere maggiore visibilità.
Che cos’è un motore di ricerca
Prima di addentrarci in questioni tecniche, è opportuno
introdurre alcuni concetti la cui menzione, tutt’altro che
puramente nozionistica, è fondamentale per la comprensione
successiva. Inoltre, la definizione di tali elementi
apparentemente ovvi può essere utile a sgombrare il campo da
eventuali equivoci o ambiguità.
Innanzitutto, che cos’è un motore di ricerca e come funziona a
livello macroscopico?
Un motore di ricerca, o search engine, è “un sistema
automatico, che analizza un insieme di dati e restituisce un
indice dei contenuti disponibili, classificandoli in base a formule
matematiche che ne indichino il grado di rilevanza data una
5
L'information retrieval (IR) è l'insieme delle tecniche utilizzate per il recupero mirato dell’informazione in formato
elettronico. Per "informazione" si intendono tutti i documenti, i metadati, i file presenti all'interno di banche dati online.
10
determinata chiave di ricerca”6. In parole semplici, il motore
analizza dei dati in input, forniti dall’utente, ed effettua una
ricerca su tale base, offrendo come output una lista di voci,
poste in ordine decrescente d’importanza, in base ai criteri di
restituzione dell’output con i quali è stato impostato.
È statisticamente provato che l' 85% degli utenti di Internet si
serve dei motori di ricerca per effettuare le proprie ricerche sul
Web7. I motori di ricerca svolgono un importante servizio di IR.
Quando, a partire dagli anni Novanta, Internet cominciò a
riempirsi di milioni di documenti, si avverti l'esigenza di
catalogarli, riordinarli, indicizzarli. In altri termini, era
necessario adottare un sistema "bibliotecario" per consentire agli
utenti di rinvenire in tempi brevi le informazioni desiderate.
Parlando di catalogazione, è opportuno chiarire sin da subito un
possibile elemento di confusione. Spesso, infatti, si parla
indistintamente di motori di ricerca per indicare qualunque
strumento per il reperimento dell’informazione. Ma esistono in
realtà differenze ragguardevoli sia nel modo di organizzare la
ricerca, sia in quello di presentare i risultati.
Per questo introduciamo ora il concetto di directory. Perché
troppo spesso le directories vengono integrate nella definizione
onninclusiva di “motore di ricerca”, mentre si tratta di strumenti
completamente diversi. Esse sono archivi di dati ordinati in
maniera gerarchica, secondo un sistema di cartelle e
sottocartelle, divise per argomento. Già da queste poche righe si
può intuire come questi due approcci viaggino per strade diverse
e portino ad altrettanto differenti risultati.
6
Lett., http://it.wikipedia.org/wiki/Motori_di_ricerca
7
Fonte: www.seoguida.com/motori-ricerca
11
Obiettivi della tesi
Tale digressione ci aiuta a focalizzare l’oggetto di questa tesi.
Abbiamo fin qui tratteggiato due modi per razionalizzare
l’informazione sul Web, entrambi efficaci pur partendo da
presupposti agli antipodi. Il primo approccio si propone, in
seguito a una query8 da parte dell’utente, di filtrare l’enorme
quantità di risorse disponibili e ordinarle in base a criteri
variabili di rilevanza. Tale attività viene effettuata agendo
sull’engine, sulla macchina, grazie a dei programmi, detti
algoritmi, che reperiscono i dati, selezionano quelli rispondenti
ai criteri della richiesta, presentano infine il materiale sotto
forma di liste ordinate; il secondo è un approccio umano,
editoriale, che organizza i contenuti con un sistema gerarchico
di natura semantica. Senza trascurare le funzionalità e
potenzialità generate dalle directories, noi ci concentreremo
sull’analisi degli elementi che regolano l’operatività dei motori
di ricerca, al fine di comprendere come avviene dal punto di
vista tecnico il posizionamento9 dei siti. Vale comunque la pena
di sottolineare che le due metodologie si intersecano in più punti
e non potranno dunque essere trattate in maniera completamente
indipendente l’una dall’altra.
Nella prima parte di questo lavoro, dopo una necessaria
introduzione storico/contestuale, che ci porterà ad inquadrare lo
scenario attuale, ci occuperemo di esplorare l’interfaccia di un
motore di ricerca. Vedremo ciò che accade a livello
macroscopico e come vi si relaziona l’utente.
Nella seconda parte comprenderemo, attraverso uno studio sulle
principali tecniche di retrieval, come sono nati i primi motori di
ricerca, quali sono i loro principi di funzionamento, quali
8
Il termine query, in informatica viene utilizzato per indicare l'interrogazione di un database in modo da ottenere dei
dati contenuti in uno o più database. In senso lato, designa una richiesta di informazioni da parte di un attore umano a
un sistema automatico.
9
Per posizionamento s’intende l’attività di migliorare o stabilizzare la posizione di un sito all’interno delle graduatorie
dei motori di ricerca in base a un determinato criterio di ricerca .
12
strategie vengono messe in atto per il reperimento e la
classificazione dell’informazione.
Nel terzo capitolo studieremo l’applicazione delle strategie di
retrieval ai motori di ricerca: vedremo come il loro impiego sia
stato complicato dalla continua crescita del Web e
conseguentemente integrato da altri metodi di classificazione.
Seguiremo i cambiamenti del paradigma della ricerca sul Web
fino ai nostri giorni, illustrando l’evoluzione tecnologica dei
motori di ricerca nell’ultimo decennio, guidata
dall’affermazione quasi monopolistica di Google.
L’analisi ad ampio raggio, effettuata in questi capitoli sul mondo
dei motori di ricerca, ci consentirà certamente di acquisire
maggiore dimestichezza e familiarità con uno strumento entrato
nell’uso comune della nostra vita quotidiana, ma del quale molto
spesso non siamo in grado di sfruttare pienamente le
potenzialità. Nel far questo, percorreremo le tappe significative
del sentiero evolutivo dei motori di ricerca, apprezzandone le
innovazioni metodologiche e tecnologiche più interessanti,
arrivando a tracciare gli scenari che si prospettano nel futuro
immediato. Giungeremo infine all’ultimo capitolo, nel quale gli
argomenti trattati troveranno il loro naturale ambito di
applicazione in un settore di grande attualità: osserveremo che la
conoscenza dei criteri di classificazione dei documenti sui
motori di ricerca è uno strumento fondamentale per chi cerca
visibilità sul Web. Il SEO è l’ambito ove si concentrano tali
conoscenze: cercheremo di esporne le linee guida mediando tra
le esigenze, non sempre facilmente conciliabili, di un
posizionamento efficace e di un orientamento collaborativo allo
sviluppo semantico Web.