8
Avendo scarsa memoria con i titoli, mi sono sempre chiesto perché nessuno si fosse mai
preoccupato di organizzare le playlists in maniera “spaziale” anziché “testuale”; un po’ come
faccio io di solito, tenendo le compilation con le canzoni romantiche in cima al raccoglitore (in
caso di cenetta intima è più facile far colpo se il primo CD in vista è proprio “quello giusto”) e
quelle con le canzoni da discoteca in fondo (perché dopo la selezione di “Jazz” e “Bossa nova”
ci vorrà pure qualche canzone dei Village People per scaricare lo stress). Insomma, se un
sistema per fare tutto ciò non esiste... proverò ad inventarmelo.
9
CAPITOLO 1
SISTEMI PER LA RICERCA DELLE INFORMAZIONI MUSICALI
1.1 INTRODUZIONE
L’ambito informatico è vitale e in forte espansione. Sempre più persone si trovano a dover
convivere con i computer, che hanno invaso praticamente tutti i campi del sapere.
Anche gli studi umanistici utilizzano scanner e fotocamere digitali per archiviare stampe,
manoscritti, illustrazioni. Tali scienze si avvalgono inoltre di memorie di massa (server con
dischi rigidi, supporti ottici, ecc.) e di strumenti software per la catalogazione nonché per lo
stoccaggio degli archivi.
Le macchine sono state create per risolvere problemi quali la conservazione, la trasmissione e
l’elaborazione dell’informazione, riuscendo ad abbattere drasticamente i tempi e i costi
solitamente sostenuti per i lavori ripetitivi. Pensiamo all’abisso che divide uno scrivano, il quale
ricopiava a mano un’opera come ad esempio i Vangeli, dal moderno studente di letteratura che
con un semplice gesto può trasferire sulla sua chiavetta USB l’intera Bibbia in formato digitale.
Tuttavia le macchine non sempre funzionano bene e anche quando funzionano, non sempre
danno i risultati attesi. I ricercatori informatici devono stare attenti a creare interfacce semplici
da usare per non incappare in situazioni paradossali; ciò accade quando lo svolgimento di una
certa operazione tramite computer richiede più tempo rispetto ai metodi classici, ma anche
quando l’utilizzo dell’interfaccia è talmente complesso da risultare proibitivo per la maggior
parte degli utenti.
1.2 SISTEMI DI IR: MODELLO BOOLEANO E MODELLO FUZZY
Il modello più semplice di Information Retrieval (che vuol dire Reperimento delle
Informazioni) si basa su operatori a due stati, di tipo “0,1” o più semplicemente “vero, falso”.
Se ad esempio volessimo ricercare il primo canto dell’Inferno di Dante Alighieri all’interno di
una collezione contenente opere letterarie, dovremmo immettere nel motore di ricerca la stringa
“Nel mezzo del cammin di nostra vita”: quest’ultimo verificherà eventuali corrispondenze con
le stringhe di caratteri presenti nel suo database.
10
Secondo quanto descritto da Antonella Pizzaleo [PIZ], esperta in multimedialità, ogni sistema
di Information Retrieval si basa su 4 componenti fondamentali:
1. un archivio di documenti, in cui il documento è l’unità di informazione reperibile
2. un meccanismo di indicizzazione e rappresentazione dei documenti, che associa ad ogni
documento in archivio una descrizione formale e sintetica del suo contenuto informativo
3. un linguaggio di interrogazione per mezzo del quale un utente esprime le proprie esigenze
informative (le cosiddette query)
4. un meccanismo di valutazione (matching) che confronta una query con la rappresentazione
dei documenti archiviati, allo scopo di verificare quali di questi soddisfano le richieste
Nei sistemi attuali sono spesso implementati sistemi di ricerca fuzzy (ossia sfumati) in cui, oltre
all’uguaglianza dei contenuti informativi, vengono attribuiti dei pesi anche ai vari gradi di
similitudine che possono esistere fra elementi diversi. Immaginiamo di cercare in un ipotetico
catalogo di canzoni la parola “rosa”; di sicuro fra i risultati ci saranno brani come “Una rosa
blu” o “Notte rosa”, ma un sistema evoluto può anche restituire titoli come “Rose rosse per te”
o “Grazie dei fior” (in cui una parte del testo recita “son rose rosse e parlano d’amor”)
basandosi sulle possibili variazioni linguistiche: nel caso fossero contemplati anche brani
stranieri, due possibili risultati alla nostra query potrebbero essere “Kiss from a rose” o “Bed of
roses”. Il motore di ricerca potrà quindi fornire in output una pagina html contenente il testo
della canzone o una versione in Mp3 del brano in modo da poterlo ascoltare. In base allo scopo
che si vuole ottenere, bisogna assicurarsi che l’informazione restituita all’utente sia non solo del
tipo desiderato, ma anche che sia presentata in modo gradevole, rispettando le regole
dell’usabilità [NIE].
1.3 INTERFACCE PER LA RICERCA DI BRANI MUSICALI
Il ramo scientifico che si occupa di estrarre informazioni inerenti files musicali è detto Music
Information Retrieval; solitamente, i ricercatori ne parlano usando l'acronimo MIR. Questo
studio analizzerà vari tipi di interazione, focalizzando l’attenzione sulla categoria a cui
appartiene ciascuna interfaccia presa in considerazione e su come l’utente si comporta al variare
delle tipologie. Verranno tralasciati molti aspetti riguardo l’organizzazione e l’indicizzazione
degli elementi, focalizzando l’attenzione sulle modalità con cui gli utenti si relazionano alle
applicazioni. Tuttavia in alcuni casi sarà necessario spendere qualche parola in più per capire
11
quanto i due aspetti siano correlati, soprattutto quando verrà analizzato il software sviluppato
all’interno del LIM.
1.3.1 PANORAMICA: INTERFACCE TESTUALI
Sono state individuate finora 4 macroaree corrispondenti al modo in cui, soprattutto nei servizi
on-line, avvengono le operazioni di immissione delle richieste:
- Interfacce testuali
- Interfacce parametriche
- Interfacce grafiche
- Interfacce sonore
Le prime includono programmi di uso comune come eMule [emu], software di scambio files
che si basa sul concetto del P2P (ossia Peer to Peer ; uno stesso utente funge da client quando
scarica i files, ma anche da server se i brani presenti nella sua cartella condivisa vengono
richiesti da altri utenti).
Figura 1.1: una schermata di ricerca tramite eMule
12
Un servizio interessante è quello offerto dal sito di Pandora [pan], che permette di creare delle
playlists partendo da un input di tipo testuale (ad esempio, un fan di Freddie Mercury potrebbe
digitare la parola “Queen”). Pandora provvederà a suggerire altre canzoni in cui viene
riscontrata similarità rispetto alla prima scelta dell’utente, basandosi su “etichette” riguardanti
ritmo, densità tonale, estensione del cantato. Il sistema di catalogazione alla base del servizio
[mgp] è complesso; lascio ad altri la trattazione dell’argomento.
La creazione di una playlist avviene in tempo reale e spesso dà risultati soddisfacenti, ma non è
possibile un confronto oggettivo con altri sistemi di interazione in quanto è impossibile avere
dati sia quantitativi che qualitativi sulla collezione musicale da cui l’interfaccia estrapola le
informazioni. Attualmente, per motivi di gestione dei diritti d’autore, il servizio è fruibile
soltanto dagli utenti che si collegano tramite provider in USA.
Figura 1.2: la schermata iniziale di ricerca di Pandora
Figura 1.3: Pandora permette di sapere “perché sta suonando questa canzone”
13
1.3.2 INTERFACCE PARAMETRICHE
Alcuni servizi internet permettono di ricercare musica attraverso parametri riconducibili ad uno
“spazio musicale multidimensionale”. Il sito di Playola [pla] incorpora un browser composto da
un riquadro sulla parte destra dello schermo - in cui compaiono i parametri (Rap, Country, ecc.)
assieme ad una barra indicante il valore dei parametri stessi, nonché i comandi “More” e “Less”
– e da un secondo riquadro sottostante, in cui vengono visualizzati i brani più “vicini” rispetto
allo spazio multidimensionale selezionato. E’presente anche la possibilità di segnare i brani
trovati come “good match” o “bad match” (già vista anche in Pandora alla Fig.1.3 sotto forma
di icone: pollice in alto e pollice in basso) per affinare le selezioni successive. Playola
implementa infine una funzione di playlist che tiene traccia degli ultimi brani richiesti
dall’utente. Una piccola curiosità: il nome payola [FAB] indica la pratica, da molti considerata
illegale, con cui le case discografiche pagano i “Disc jockey” affinché trasmettano in radio le
nuove canzoni da promuovere. In effetti anche qui vengono proposti dei brani con lo scopo di
venderli successivamente on-line; si spiega così il gioco di parole.
Figura 1.4: l’interfaccia di Playola
14
1.3.3 INTERFACCE GRAFICHE
Le applicazioni che utilizzano un’interfaccia grafica per ricercare e visualizzare informazioni
musicali sono quelle attualmente in fase di grande sviluppo. Questo per vari motivi:
- Il forte “appeal” che suscitano delle interfacce ben curate nei confronti degli utenti
- L’intuitività del loro utilizzo, in grado di competere con le interfacce testuali
- Lo stimolo “ludico” che deriva dalla visione e dall’interazione
Una riflessione doverosa è questa: perché il programma più diffuso per la riproduzione di
musica, Windows Media Player, incorpora così tante skin nonché “effetti grafici” (alcuni dai
nomi davvero strani come ad esempio “Spider’s last moment...”, “Green is not your enemy”,
“My tornado is resting”), oltre a varie opzioni che permettono di personalizzare i colori
dell’interfaccia software? La risposta è che l’utente così può avvalersi di stimoli piacevoli sia
dal punto di vista uditivo (la musica che sta ascoltando) sia da quello visivo, scegliendo “cosa
guardare”.
Avremo modo, nei prossimi paragrafi, di notare come questi abbellimenti grafici servano anche
a mascherare i punti deboli del software.
1.3.3.1 MUSICLENS
Questo servizio [mus], permette di scegliere fra numerosi parametri tramite degli sliders simili a
quelli di un mixer. Il dettaglio fondamentale che mi ha fatto collocare il servizio in questa
categoria è che, pur essendo simile a Playola, nella schermata compare un grafico in alto a
sinistra: in base ad ogni slider attivato, viene evidenziato un settore dell’area totale che appare
piatto per valori dello slider uguali a 0 (posizione centrale); tale settore apparirà convesso
(come un “rilievo montuoso”) quando lo slider relativo assume valori positivi e concavo
quando assume valori negativi. L’utilità è duplice: da un lato, si può intuitivamente capire quale
parametro influisce maggiormente sulla ricerca (il “monte” più alto o il “dirupo” più ripido),
dall’altro è più facile memorizzare un “panorama” di questo tipo che ricordare i valori dei
singoli potenziometri. Infine, i valori attribuibili agli slider danno una sensazione di continuità a
differenza dei parametri presenti in Playola, a cui si possono attribuire solo valori discretizzati
in base ad una scala. E’ da notare poi l’utilizzo di parametri legati al mood:
15
- Purpose: lo “scopo” per cui si vuole ascoltare musica. Fra i valori di riferimento
compaiono i termini “Listening”, “Driving”, “Sex”, “Dance”.
- Mood: lo stato d’animo dell’utente. Fra i valori possibili troviamo “Angry”, “Sad”,
“Normal”, “Smile”.
- Colour: una barra in cui è possibile selezionare un qualsiasi colore dello spettro
visibile. E’ probabilmente legata ad una convenzione sinestetica stabilita dai
programmatori (un’ipotesi potrebbe essere: rosso = musica allegra, blu = musica
rilassante).
Anche in questo caso la musica si conferma un fenomeno multidimensionale, in cui vengono
stabilite correlazioni fra parametri oggettivi, come ad esempio la densità tonale o la velocità
ritmica espressa in Bpm (acronimo di Beats per Minute - pulsazioni al minuto) e parametri
percettivi come la ritmicità, l’allegria, la rumorosità di un brano.
Figura 1.5: la veste grafica di MusicLens
16
1.3.3.2 MUSICREAM
Navigando sul web, mi sono imbattuto nel video dimostrativo di un software davvero
interessante. Anche se, per adesso, non è previsto un suo utilizzo on-line, mi sembra giusto
parlarne. Musicream, presentato all’ISMIR 2005 [Got], viene definita come “New music
playback interface for streaming, sticking, sorting and recalling musical pieces”. In effetti,
l’applicazione sviluppata da Takayuki e Masataka Goto (cognome che ricorda un’istruzione in
Basic) riesce a gestire brani e playlists in maniera intuitiva. Vediamo nel dettaglio come
funziona: ci sono 3 “rubinetti” in alto a destra nella schermata iniziale. E’ possibile selezionare
un’apertura diversa per ciascun rubinetto: maggiore è l’apertura e maggiore sarà la frequenza
con cui le “gocce” scenderanno. Ogni goccia rappresenta un brano musicale; quando il
puntatore del mouse scorre sopra un brano, la goccia si ingrandisce e permette di visualizzare il
nome dell’artista e il titolo della canzone.
Figura 1.6: le “gocce” e la visualizzazione delle informazioni del brano
Trascinando una goccia sul lato sinistro dello schermo, possiamo ascoltare la canzone: in