5
INTRODUZIONE
Al giorno d’oggi il mondo si è evoluto e con esso anche gli strumenti di comunicazione, come
è accaduto ad Internet ed i suoi motori di ricerca. Il Web è diventato una vera banca di dati
nella quale è possibile trovare qualsiasi cosa si desideri. Di conseguenza a quest’affermazione
si può dire che sul Web si viene a creare una nuova tipologia di comunicazione che vede
coinvolti vari soggetti con esigenze diverse, ma con un unico obiettivo: il successo di questa
comunicazione e la soddisfazione degli utenti. Negli anni 90 con l’avvento del Web
1
inizia la
scalata verso la dipendenza da questo media, in quanto, a oggi le persone basano molto le loro
scelte su ciò che riescono a trovare sui motori di ricerca e quando iniziano un’indagine lo
fanno perchØ esprimono un interesse verso un qualche argomento particolare. La ricerca di
dati e d’informazioni
2
è un’attività che si svolge quotidianamente, come può essere ad
esempio la consultazione di un catalogo della biblioteca o la stampa dell’elenco degli esami
attraverso i sistemi informativi dell’università. Per fare ciò si necessita principalmente di un
sistema informatico in grado di memorizzare e gestire le informazioni d’interesse, rendendo
così possibile le operazioni di reperimento e di aggiornamento dati in ogni momento. I sistemi
informatici per la gestione dei dati sono capaci di memorizzarli nel tempo e di fornire loro un
ambiente interpretativo che li rende delle informazioni utili per gli utenti. Nella
comunicazione sul Web quindi ritroviamo le persone, le quali attuano una ricerca
principalmente per due motivi, o perchØ gli si presenta loro un problema e devono trovare una
soluzione, o per soddisfare i propri desideri. Inoltre vi è il motore di ricerca
3
, che è una
piattaforma Web dove sono compiute le ricerche degli utenti e che dà l’opportunità a
chiunque di pubblicare contenuti sul Web, in modo corretto e rilevante, perchØ poi ne
usufruiranno gli utenti. Infine vi sono poi i fornitori di questi contenuti presenti sul Web, che
grazie alle tecniche della Search Engine Optimization
4
(SEO), possono creare ottimi prodotti,
intercettare gli utenti e in seguito stabilire una connessione con loro, cercando di soddisfare al
meglio le loro esigenze. Arriva anche in Italia la consapevolezza che il Web è una grande
occasione per la promozione e la crescita di un’attività, poichØ offre numerose opportunità.
Lo scopo principale diventa il cercare di farsi conoscere nel modo migliore e farsi trovare
nella maniera piø veloce attraverso il Web: ciò è stato reso possibile con la creazione di siti
Web. Se si crea un sito, lo si fa per vari motivi, come cercare di pubblicizzare qualcosa, o
1
Guida, La qualità dei siti Web per il successo dell’impresa, 2011 – (pag. 19).
2
Con dato si intende un insieme di simboli e l’informazione è un dato messo in relazione con la proprietà a cui si riferisce
(Calvani, Rotta, 1999).
3
Il motore di ricerca è un servizio del Web che a partire da un input costituito dalla richiesta dell’utente, fatta con keyword,
restituisce come output una lista di collegamenti a risorse Web, rilevanti per le chiavi di ricerca (Montangero, 2013).
4
Fontebasso, Come si fa a promuovere con Google, 2006 – (pag. 3).
6
introdurre delle informazioni su un determinato argomento, o per aumentarne la visibilità di
un’attività. S’inizia a ragionare quindi sulle possibilità di poter far raggiungere a un sito i
propri obiettivi nel minor tempo possibile, così da poter soddisfare l’obiettivo principale per il
quale viene creato un qualsiasi tipo di sito Web, attirare piø utenti. Tra tutti i motori di ricerca
che vi sono su Internet, Google è il piø noto e anche il migliore; ogni giorno è utilizzato da
milioni di persone in tutto il mondo
5
e tutti coloro che hanno un sito Web possono usarlo per
promuovere la propria attività o sito. La domanda che sorge spontanea è perchØ proprio a
Google è assegnato questo riconoscimento. Questo merito non gli è stato attribuito per caso,
ma sono stati gli utenti che l’hanno preferito tra tutti, infatti, è quello che offre i risultati
migliori, nel minor tempo possibile, soddisfacendo al meglio le esigenze degli utenti.
Questo gli è permesso grazie alla sua solida struttura e al suo algoritmo
6
sempre al passo con i
tempi, che cerca sempre di migliorarsi in tempo reale. La cosa principale per essere
considerato un buon sito dal Web è farsi trovare facilmente dai navigatori e utenti e per fare
ciò, la cosa fondamentale è cercare di creare un sito ben costruito dal punto di vista degli
utenti e dei motori di ricerca. Quando si parla di visibilità sui motori di ricerca, bisogna far
riferimento a due macrogruppi. Da un lato troviamo la Search Engine Advertising
7
(SEA), che
si occupa della pubblicità a pagamento per costruire una buona reputazione del sito.
In base a questa Google offre un servizio online per la promozione di un sito, attraverso il suo
posizionamento non organico. L’altra macrocategoria di cui bisogna tenere conto, che si basa
sul posizionamento organico del sito e che permette di dare visibilità al sito, è definita Search
Engine Optimization (SEO) e il suo valore reale è dato soprattutto dai contenuti testuali.
¨ una tecnica di ottimizzazione delle pagine Web offerta dall’algoritmo di Google, secondo
cui si prevede che un sito per essere ben considerato ed essere così posto tra i primi risultati
sulle pagine di Google, debba avere determinate caratteristiche, che secondo il suo algoritmo
sono ottimali e fondamentali per essere un buon sito. Di conseguenza, se s’impara a usare al
meglio il sito si sarà al posto giusto nel momento adatto, sulle pagine di Google, utilizzando
gli strumenti pubblicitari e valorizzando i propri contenuti, il sito riuscirà a collocarsi al
meglio nelle pagine dei risultati selezionati dall’algoritmo. Questa tesi ha l’obiettivo di capire
l’immenso mondo di Google e principalmente come funziona l’affascinante processo di
ottimizzazione SEO, dal momento che gli algoritmi di Google si proiettano sempre di piø
verso la direzione di premiare i contenuti originali
8
, che sono ricompensati dagli utenti, quindi
5
Brivio, Trovare su internet, 2006 – (pag. 3).
6
L’algoritmo è una sequenza ordinata e finita di istruzioni elementari per realizzare un trattamento di informazioni e conduce
a un determinato risultato in n tempo finito. (PorroSoftware, 2016).
7
Fontebasso, Come si fa a promuovere con Google, 2006 - (pag. 99).
8
Con “contenuti originali” si fa riferimento a testi nuovi, diversi, ricchi e pieni di argomenti interessanti. (Bottarelli, 2014).
7
si dirige verso quelli che sono i temi portanti di una politica SEO. In questo documento si
vedrà anche come la SEO, al fianco dei motori di ricerca, è sempre in evoluzione e oggi
alcune tecniche, considerate in passato ottime per ottenere un buon posizionamento di un sito,
sono state abbandonate, causa la penalizzazione ai siti che le attuano. Questo accade perchØ
con il progresso, la SEO si avvicina a un’ottica piø semantica e quindi analizzeremo questa
politica da un punto di vista semantico, considerato che il Web tradizionale prevede
un’estensione inventata da Tim Berners Lee: il Semantic Web
9
. Questo Web prevede di
dotare le macchine di un’intelligenza artificiale
10
e secondo le teorie dichiarative la strada
verso quest’obiettivo era dotare le macchine di basi di conoscenza per descrivere in maniera
dichiarativa le caratteristiche di un dominio applicativo. Sulle basi della conoscenza si poteva
poi operare con tecniche di ragionamento automatico e di problem-solving. Accade spesso
che la simbologia, con cui sono rappresentati i dati, non risulti utile per la loro interpretazione,
in quanto sul Web vi è una quantità elevata di dati eterogenei, i quali possono avere diversi
significati in relazione al contesto in cui sono inseriti. Infatti, vi è un divario tra i metodi con
cui sono memorizzati i dati e il loro significato, in altre parole la loro sintassi e la loro
semantica. Questo accade perchØ ogni parola porta con sØ piø di un significato e questo è
importane per le intelligenze artificiali visto che i diversi programmi si stanno sviluppando
verso questa direzione, nella redazione di sceneggiature caratterizzate da reticolati
d’ispirazione enciclopedica. In sintesi ciò che fa il Web Semantico è quello di attribuire un
significato ben definito alle informazioni, così da rendere possibile una cooperazione tra
esseri umani e macchine. Nelle prime pagine sarà analizzato il funzionamento dei motori di
ricerca, che con il loro sviluppo hanno incoraggiare una ricerca semantica. In seguito si vedrà
l’argomento riguardante le tecniche di ottimizzazione per i motori di ricerca ed infine
cercheremo di introdurci in un ambiente ancora poco conosciuto, che riguarda una nuova
tipologia di Web introdotta nel XXI secolo a seguito della continua evoluzione tecnologica.
Il Web Semantico mette a disposizione linguaggi e tecniche per rappresentare la descrizione
Semantica di ogni pagina Web. In questo modo, il Web, i motori di ricerca, i siti e le tecniche
SEO saranno improntati in un’ottica semantica e tutto ciò permetterà al motore di compiere
una ricerca piø precisa nel momento in cui sarà interrogato. Inoltre sarà capace di
comprendere le volontà degli utenti, il significato delle loro ricerche ed infine fornire loro le
pagine piø adatte.
9
Di Noia, De Virgilio, Di Sciascio, Donini, Semantic Web: Tra ontologie e Open Data, 2013 – (pag. 2).
10
Schneider, Gersting, Gentile e Pirrone, Informatica, 2013 – (pag. 419).
8
1. CAPIRE GOOGLE E I MOTORI DI RICERCA
Innanzitutto bisogna fare un primo riepilogo riguardante i motori di ricerca e il loro
funzionamento, in quanto è necessario comprendere questi, prima di passare al livello
successivo e vedere le tecniche di ottimizzazione per i motori di ricerca e la loro visione
semantica. Ci interessiamo principalmente a Google, poichØ è il motore di ricerca piø
utilizzato al mondo. Per utilizzare Google, così da promuovere un sito Web
11
, o un’attività in
modo efficace, bisogna capire come funziona un motore di ricerca e come si compone una
pagina di risultati. Perciò si deve comprendere, principalmente, come funzionano gli algoritmi
di cui sono composti i motori di ricerca, utilizzati per classificare i siti, e quali metodi
utilizzano per presentare i risultati e far si che una pagina web venga indicizzata, affinchØ un
sito web possa ambire a scalare posizioni e di conseguenza attrarre sempre piø traffico
12
, ossia
utenti diretti verso le sue pagine. Sintetizziamo il tutto affermando che inizialmente il sito per
esistere sul Web deve essere indicizzato, in seguito può passare alla seconda fase che è il suo
posizionamento e quindi cercare di raggiungere determinate posizioni sulle pagine del motore.
1.1 Composizione delle pagine
Dal punto di vista tecnico, il motore di ricerca è un sistema automatico che usa allo stesso
tempo data base, software
13
e algoritmi matematici per riuscire a trovare informazioni sul
Web legate alla parola chiave richiesta dall’utente nel momento in cui attua una ricerca.
Il fatto che Google sia riconosciuto il migliore tra i motori di ricerca è dato dalla qualità degli
strumenti che utilizza; infatti, ha un potente algoritmo capace di effettuare ricerche veloci nei
data base e inoltre ha degli strumenti software molto efficaci, che permettono di analizzare
velocemente tutte le informazioni sul Web. Come afferma Tim Berners Lee
14
, il fondatore del
Web, il data base è un grande archivio elettronico da cui sono recuperati i dati d’interesse, in
quanto sono memorizzati e conservati nel tempo. Piø semplicemente il data base o, piø
semplicemente, base di dati è una collezione di dati correlati, creata con lo scopo specifico di
rappresentare adeguatamente e memorizzare le informazioni relative a una realtà di interesse.
Ad esempio la base di dati che si riferisce agli esami di un’università, conterrà dati su
studenti, corsi di laurea, esami e docenti. Un’altra caratteristica della base di dati è che gli
elementi vengono costantemente aggiornati nel tempo per fornire dati sempre attuali.
11
Un sito Web è un insieme di pagine che godono di una certa coerenza su vari aspetti come possono essere l’argomento
trattato e la loro collocazione virtuale. (Guida, 2011).
12
Il traffico in internet è il risultato delle interazioni di molti di utenti, diverse applicazioni e protocolli. (Accoto, 2007).
13
Il software è l’insieme delle procedure e delle istruzioni in un sistema di elaborazione di dati e si identifica con un insieme
di programmi. (Laudon e Laudon, 2006).
14
Castano, Ferrara e Montanelli, Informazione, conoscenza e Web per le scienze umanistiche, 2009 - (pag. 123).
9
Dal punto di vista formale i motori di ricerca sono composti da un prodotto editoriale
15
,
motivo principale per cui vengono consultati, e da elementi pubblicitari; sono ciò che
permette al motore di valutare in denaro la propria audience. Il contenuto editoriale è
rappresentato dai risultati di ricerca organici, quelli prodotti dall’algoritmo di ciascun motore
e dall’indice. Questo contenuto è rappresentato dalla fonte che si trova al centro della pagina,
ovvero i risultati naturali del motore, forniti dal suo algoritmo e che fanno parte della Search
Engine Optimization. La componente pubblicitaria è fornita da strumenti di advertising “pay
per click”, come fa AdWords per Google, che fornisce i cosiddetti link sponsorizzati
16
.
Possiamo individuare questa componente ai lati dei siti e sono strategie racchiuse nella tecnica
definita Search Engine Advertising. Per la promozione della propria attività è fondamentale
capire che si può ottenere visibilità e traffico attraverso entrambi i posizionamenti.
1.2 Come funziona un motore di ricerca
I siti che avranno piø possibilità di essere visitati sono quelli che si trovano tra le prime
cinque posizioni nella pagina dei risultati di ricerca, la così detta Search Engine Result Page
17
(SERP), ossia la pagina dei risultati del motore di ricerca, che è anche una qualunque pagina
di Google che compare dopo avere inserito le parole chiave per compiere una ricerca.
Queste posizioni, considerate di prestigio, poichØ non si possono raggiungere facilmente, è
possibile comprarle con la pubblicità a pagamento, la Search Engine Advertisement (SEA) o
si possono raggiungere usando le tecniche di ottimizzazione SEO. Il raggiungimento di queste
posizioni sarà sicuramente assicurato se s’intraprendono entrambe queste due tecniche. Per
spiegare come funziona un motore di ricerca, si deve partire dal momento in cui viene iniziata
una indagine. Aprendo l’home page di Google e facendo una ricerca, il motore trova una
risposta nel suo data base di documenti, cos’ da poter replicare in modo ottimale alle Query
18
,
ossia a una qualunque ricerca effettuata sul motore. Infatti, quando vengono inserite una o piø
parole nel campo di ricerca di Google, si sta eseguendo appunto la così detta Query.
Per capire meglio come Google risponde alle nostre domande, come classifichi i siti, le pagine
Web e come costruisca il suo ranking
19
, o piø semplicemente la sua classifica dei risultati
rispetto a una determinata Query, bisogna innanzitutto capire come viene costruito questo
indice, che è sostanzialmente un archivio da cui sono presi i vari risultati.
Inizialmente facciamo una prima distinzione tra veri e propri motori di ricerca e le directory.
15
Fontebasso, Come si fa a promuovere con Google, 2006 – (pag. 3).
16
Nielsen, Loranger,Web usability 2.0. L'usabilità che conta, 2006 - (pag. 39).
17
De Nobili SEO Google, 2015 - (pag. 4).
18
Con Query si intende la ricerca effettuata da un utente su un motore di ricerca inserendo la domanda nel box di ricerca del
motore. (Gnoli, Marino, Rosati, 2006).
19
Montangero, Tecnologia della comunicazione, 2013 – (pag. 49).
10
Un motore di ricerca ci proporrà un elenco di singole e distinte pagine, o piø correttamente di
documenti, e quindi gli indirizzi Web che secondo l’algoritmo di Google rispondono alle
nostre esigenze. Al contrario le directory
20
sono elenchi di siti, categorizzati per argomenti
d’interesse e che sono inseriti in base al loro dominio
21
, in aggiunta si necessita di un
intervento umano per la creazione di categorie e sottocategorie, e per inserire in ognuna di
queste i vari siti secondo l’algoritmo. Un buon passo è inserire il sito nella giusta directory dei
portali, ossia nei siti dove sono inseriti gli altri siti, farlo secondo strutture gerarchiche o ad
albero e suddividerli per categorie in base all’argomento.
Oggi questo lavoro di categorizzazione è svolto direttamente da Google in base ai contenuti di
un sito. Dal punto di vista della ricerca non è possibile dare un ranking migliore a un sito
piuttosto che un altro, se non sulla base della preferenza umana verso un particolare editore o
di una caratteristica predeterminata, e perciò non risulta semplice attribuire una specifica
categoria a siti che trattano un argomento troppo ampio.
Dal punto di vista dell’utente, bisogna porre l’accento su come una ricerca in una directory
porti sempre come risultato un elenco di home page e non colleghi mai direttamente alla
pagina piø interessante di un sito. Un tipico errore è quello di pensare che Google classifichi
interi siti, che proponga elenchi di domini e che le attività di ottimizzazione e posizionamento
abbiano effetto organico su tutto il sito. Il procedimento che porta alla creazione del data base
dove si esercitano le ricerche è chiamato indicizzazione o creazione dell’indice, processo
mediante il quale un software aggiunge continuamente del materiale al data base del suo
motore di ricerca, per poi restituirlo ordinato in una classifica stilata in base alla pertinenza
con la chiave di ricerca inserita quando viene eseguita una Query. Questo processo si
compone di due diversi passaggi.
Il primo passaggio detto “crawling”
22
, ovvero il reperimento di tutte le pagine presenti nei vari
siti Web, le quali soddisfano determinati criteri di qualità e consistenza, da parte di un robot
detto spider che ha il compito di renderle indicizzate. La seconda fase è definita ’indexing”
23
,
non è altro che il filtraggio e l’analisi dei documenti precedentemente identificati dallo spider
e dei dati associati a ogni documento, così da formare infine l’indice di ricerca definitivo.
20
Clerici, De Pra, Informatica e Web, 2012 – (pag.13).
21
Il dominio è una sezione logica della rete internet identificata da un nome e costituita da una o piø sottoreti. Di solito sono
formati da piø parti che insieme permettono di identificare in modo univoco un sito. (Bottarelli, 2014).
22
Crawling è un termine inglese che si traduce con il termine scansione. (Di Fraia, 2012).
23
Indexing si traduce in indicizzazione ed è la creazione dell’indice di ricerca. (Di Fraia, 2012).