Identificazione di immagini contraffatte con una tecnica basata sull’analisi della doppia
compressione Jpeg
5
Introduzione
Il mondo di oggi è sempre più un artefatto delle idee degli uomini. E‟ difficile fare
affidamento sui sensi messi a disposizione dalla natura, quando la tecnologia propone
strumenti in grado di ingannarli senza sforzo alcuno. In particolare la fotografia ha
cambiato il modo di ricordare, i contorni si sono fatti sempre più definiti, soppiantando le
tele e le loro suggestioni e, come spesso capita, alla conquista di una scoperta corrisponde
il desiderio di farla propria, di romperne gli schemi e i contorni. E‟ da qui che è nato il
desiderio di intervenire per divertimento, quanto per utilità, nella modifica delle immagini
digitali, che offrono un ottimo terreno per questo tipo di pratiche.
Spesso però fattori come la privacy e la legalità diventano cruciali nel limitare la
manipolazioni di immagini di dominio pubblico, o utilizzate per identificazioni in caso di
illecito. Allo sviluppo delle tecniche per la modifica delle immagini si è quindi affiancato
quello delle tecniche per l‟identificazione delle prime, allo scopo di proteggere
l‟autenticità delle immagini digitali.
Nei capitoli a seguire verranno presentate alcune tecniche per la rilevazione di artefatti,
utilizzabili a supporto della percezione dell‟occhio umano che non è in grado di
discriminare alcune modiche che possono sovvertire la semantica oltre che l‟autenticità
dell‟immagine. In particolare si porrà attenzione sullo standard Jpeg
(Joint Photographic Experts Group), primo standard internazionale sulla compressione di
immagini a tono continuo, sia a livello di grigio che a colori,e ai risvolti dovuti alla sua
implementazione per la rilevazione di immagini contraffatte. Infine si propone una tecnica
basata sulla classificazione che risulta efficace in un buon numero di casi, pur presentando
Identificazione di immagini contraffatte con una tecnica basata sull’analisi della doppia
compressione Jpeg
6
delle limitazioni di utilizzo. Le modifiche all‟algoritmo di base prevedono l‟estensione
della tecnica alle immagini a colori per ottenere un aumento dell‟accuratezza con un
piccolo incremento di complessità computazionale.
I risultati dell‟algoritmo studiato permettono altresì di risalire a caratteristiche
identificative dell‟immagine rilevata e di eventuali contraffazioni, e ciò può essere
utilizzato anche per applicazioni di steganalisi, dove l‟accuratezza e le prestazioni delle
tecniche sono parametri stringenti per la selezione dell‟approccio d‟investigazione.
Il campo dell‟identificazione delle immagini digitali è in continuo sviluppo e segue
l‟affermarsi su larghissima scala dei dispositivi per l‟acquisizione delle immagini digitali.
In particolare sensori per la raccolta delle immagini possono essere installati all‟interno
dei dispositivi mobili più disparati, fornendo ad una vasta gamma di utenti la possibilità di
utilizzare tecnologie di acquisizione e adattamento di immagini digitali, che vengono
manipolate da software automatici ancor prima di essere fruibili. Nei prossimi capitoli
verrà fornita una trattazione ampia circa le tecniche di rilevazione di manomissioni di
immagini digitali, in particolare dopo una prima introduzione riguardante la valenza socio-
politica del lavoro si passerà nel primo capitolo ad analizzare il problema in maniera più
formale. Il secondo capitolo propone un excursus sullo stato dell‟arte e quindi sulla
classificazione delle tecniche ad oggi note. Il terzo capitolo pone l‟attenzione sulla tecnica
implementata, in particolare analizza le feature introdotte da una doppia compressione
Jpeg che sono alla base della metodologia di analisi in seguito implementata. Il quarto
capitolo propone una serie di test effettuati per dimostrare le potenzialità della tecnica e
confrontare alcune sue varianti. Infine nelle conclusioni si propongono alcuni possibili
sviluppi futuri del lavoro proposto.
Identificazione di immagini contraffatte con una tecnica basata sull’analisi della doppia
compressione Jpeg
7
Capitolo 1
Analisi del problema
I contesti e le situazioni in cui la manipolazione delle immagini può avere un ruolo chiave
sono molteplici, basti pensare alla facilità con cui è possibile realizzare tali pratiche
servendosi di software di editing, che permettono all‟utente finale un utilizzo trasparente
ed intuitivo di strumenti matematici molto potenti che permettono di elaborare il segnale
digitale sintetizzato dalla fotocamera o più in generale dal sistema di acquisizione.
I risvolti di tali applicazioni in ambito socio-culturale sono notevoli, data la forza
comunicativa dei media che possono fermarsi al gossip, ma facilmente sconfinare nella
politica. Da ciò si deduce che lo sviluppo delle tecniche di elaborazione delle immagini e
della loro possibile identificazione riceve spinte molteplici sia in un senso che nell‟altro.
Nonostante si associ l‟avvento degli strumenti digitali agli ultimi anni, o almeno la loro
diffusione, la fotografia ha radici storiche più „antiche‟. I primi studi sull‟ottica e la
chimica, alla base della fotografia realizzata con segnali analogici com‟è la luce che
impressiona sostanze fotosensibili, risalgono agli inizi del 1800, quando Joseph Nicephore
Niepce cominciò a sperimentare la sensibilità alla luce del cloruro d‟argento. La figura 1.1
riporta una fotografia scattata dallo stesso Niepce nel 1826, con un tempo di esposizione di
8 ore che dà l‟impressione che la luce illumini l‟edificio sia da destra che da sinistra.
Da quel momento in poi lo sviluppo ha portato a perfezionare le tecniche di acquisizione
del segnale dovuto all‟impronta luminosa della luce e in seguito alle prime manipolazioni.
Nel 1860 l‟allora presidente degli Stati Uniti d‟America Abraham Lincoln ha
Identificazione di immagini contraffatte con una tecnica basata sull’analisi della doppia
compressione Jpeg
8
commissionato la „creazione‟ di un‟immagine che gli desse una parvenza eroica, da
mostrare in pubblico. Con le risorse tecniche dell‟epoca è stato comunque possibile
raggiungere un buon risultato, utilizzando la testa del presidente con il corpo di un altro
uomo che aveva la posizione desiderata (in particolare si trattava del politico John
Calhoun). La figura 1.2 riporta Abraham Lincoln con il corpo di John Calhoun.
Un‟ulteriore dimostrazione, forse più esplicativa del valore comunicativo che può avere
Figura 1.2 - Falso di Abraham Lincoln
Figura 1.1 - J. N. Niépce: Vista della camera a Le Gras
Identificazione di immagini contraffatte con una tecnica basata sull’analisi della doppia
compressione Jpeg
9
una semplice immagine, viene dalla Russia di Stalin. Come spesso accade nei regimi
totalitari alcuni personaggi molto vicini al dittatore vengono „eliminati‟, com‟è accaduto a
Nikolai Yezhov, capo del NKVD (polizia segreta sovietica). Quest‟ultimo ha visto la sua
triste sorte nella vita accompagnata da un medesimo trattamento negli archivi fotografici,
dove è stato letteralmente cancellato da tutte le fotografie che lo ritraevano con Stalin. Le
Figure 1.3 e 1.4 mostrano l‟originale e l‟artefatto [10].
Modificata era anche l‟immagine del duce che lo ritraeva in un atteggiamento impavido, in
sella ad un destriero tenuto fermo da un addestratore, sapientemente rimosso
Figura 1.3 – Stalin insieme a Nikolai Yezhov
Figura 1.4 – Foto ritoccata in cui non appare più Yezhov
Identificazione di immagini contraffatte con una tecnica basata sull’analisi della doppia
compressione Jpeg
10
dall‟immagine (fig. 1.5).
Se le manipolazioni su immagini realizzate con dispositivi primitivi fornivano buoni
risultati, con l‟avvento del digitale si sono ulteriormente perfezionate.
La rete propone immagini quasi esclusivamente elaborate, con interventi perfettivi o volte
ad adattare il soggetto al fine desiderato. Per esempio si può osservare come un software
di editing di immagini consenta in maniera relativamente semplice di migliorare la resa di
un volto, in modo da avere un impatto visivo notevolmente migliorato nel soggetto in
esame.
La figura 1.6 mostra un elaborazione di questo tipo.
Figura 1.5 – A destra foto utilizzata per la propaganda fascista, a sinistra foto originale
Figura 1.6 – A sinistra immagine originale, a destra visualizzazione migliorata
Identificazione di immagini contraffatte con una tecnica basata sull’analisi della doppia
compressione Jpeg
11
Data la loro natura digitale, le immagini contraffatte sono difficilmente individuabili a
occhio nudo, se realizzate da un utente esperto, e ciò comporta il ricorso a tecniche
specializzate che si servono di caratteristiche nascoste alla visione umana per rilevarne le
modifiche.
Vi sono altresì parecchie situazioni in cui è necessario stabilire l‟autenticità di
un‟immagine qualora questa venga utilizzata come parte integrante di una operazione
legale o come elemento alla base di un‟identificazione di cose o persone.
Una prima soluzione a questa tipologia di problema può essere il watermarking che
consiste nell‟inserire una firma digitale (Watermark) all‟atto della creazione
dell‟immagine, che può essere in seguito estratta.
La presenza del Watermark deve essere impercettibile, e può essere utile per stabilire
l‟autenticità di un documento, o di un file la cui distribuzione è vincolata al copyright.
La firma digitale subisce le stesse modifiche dell‟immagine che la contiene e questo rende
possibile individuarle o almeno capire che c‟è stata una manomissione. Una possibile
tecnica può essere quella di dividere l‟immagine in blocchi e marchiarne ognuno con una
particolare firma digitale (ad esempio dipendente dal tipo di device con cui è stata salvata
la fotografia). Dopo un‟eventuale manomissione, la correlazione tra i blocchi può rilevare
la modifica effettuata.
I limiti del Watermarking sono individuabili nella necessità di un hardware adatto ad
inserire tale firma al momento della registrazione dell‟immagine.
I recenti progressi permettono di operare in assenza di Watermark o hardware
specializzato [11].
La tesi si propone di illustrare le tecniche più diffuse, focalizzando l‟attenzione sullo
standard Jpeg, attualmente il più diffuso per la compressione di immagini digitali.
In particolare si propone una tecnica basata sulla classificazione delle caratteristiche di
immagini Jpeg, analizzando le prestazioni della tecnica con immagini in scala di grigi e
nello spazio di colori YCbCr (approfondito in seguito).