3
Figura 1: alcuni tipi di tessitura. Dall alto a destra e in senso orario: l’erba, l’edera, i mattoni, la griglia metallica.
Figura 2: struttura di alcuni tipi di tessitura. Si osservi la differenza tra struttura casuale e struttura ripetitiva.
4
indeterminata. Ma non tutte le tessiture temporali ricadono in questa area anche se Ł quella
maggiormente studiata perchØ la piø diffusa.
¨ possibile distinguere altri tipi di moto come le attivit che sono periodiche nel tempo
ma ristrette nello spazio e gli eventi di moto che sono caratterizzati da singoli moti che non si
ripetono nel tempo e nello spazio.
¨ anche possibile caratterizzare la tessitura temporale sulla base delle deformazioni
fisiche che avvengono durante il moto [2]. Il piø semplice tipo di moto Ł quello rigido nel
quale non vi Ł alcun tipo di deformazione: tutte le distanze e gli angoli degli oggetti in
movimento sono conservate. Se in tali tipi di moto si considerano piø oggetti i quali si
muovono con moto non rigido tra di loro si parla di moto articolato. Continuando a ridurre i
vincoli si arriva al moto elastico che Ł un moto con deformazione. Molti tipi di tessitura
temporale appartengono a questa classe di moto anche se in presenza di oggetti liquidi o
gassosi si parla di moto fluido.
In verit vi sono anche tessiture temporali che appartengono alla classe dei moti
traslatori (si pensi ad esempio ad un osservatore che guarda fuori dal finestrino di un treno in
movimento).
Tuttavia le tessiture temporali che appartengono alla classe dei moti naturali, come gi
detto, sono le piø diffuse e le piø intuitive per l’uomo. Il loro riconoscimento Ł indispensabile
per la vita quotidiana non solo umana ma di tutti gli esseri viventi che usano la vista come
mezzo fondamentale di orientamento e sopravvivenza.
Anche nella visione robotica spesso si Ł trascurata l’analisi della tessitura temporale con
il risultato che il raggiungimento di alcuni obbiettivi non Ł stato possibile. ¨ difficile
distinguere un prato da un bosco senza fare un analisi di questo tipo.
Obbiettivo della presente tesi Ł l’analisi degli aspetti spaziali e temporali della tessitura,
ai fini della definizione di un modello che pu essere utilizzato per il riconoscimento di
particolari tipi di sequenze, per la segmentazione in zone omogenee dei dati di ingresso o per
la sintesi di nuove tessiture temporali.
1.1 Obbiettivi e applicazioni
Nell’ambito di questa tesi si Ł cercato di definire una metodologia di analisi e rappresentazione
dei vari tipi di tessitura temporale, supportandola con adeguati strumenti software. A tal fine il
primo problema che si Ł posto Ł quello relativo alla rappresentazione degli aspetti temporali e
spaziali della tessitura. Tale rappresentazione deve consentire il riconoscimento di una
sequenza video e la sua classificazione.
5
Un modello che si adatta bene a questo tipo di analisi Ł l’analisi autoregressiva spazio-
temporale che lega linearmente un pixel con quelli presenti in un suo intorno spaziale e
temporale. Tale analisi permette di concentrarsi su un aspetto della percezione visiva che Ł
molto importante per gli esseri viventi: chiunque Ł piø attratto da immagini dinamiche che da
quelle statiche e spesso le situazioni di emergenza e i riflessi incondizionati sono stimolate da
questo tipo di visione. Risulta allora chiaro che una analisi della tessitura temporale effettuata
analizzando un singolo frame alla volta non permette di catturare tutte le informazioni,
escludendo quelle associate alla dimensione temporale. ¨ pero ovvio che una analisi
tridimensionale richiede una potenza di calcolo e una capacit di risoluzione maggiore, il che
ha fatto spesso preferire l’analisi bidimensionale.
Fino a qualche anno fa infatti i computers non avevano sufficiente disponibilit di
RAM, spazio su disco rigido e potenza di calcolo necessaria per questo tipo di applicazioni,
limitandone l’uso in ambienti scientifici. Oggi la tecnologia disponibile comincia ad essere
adeguata alla necessita di sistemi in grado di acquisire ed elaborare immagini e adatti alla
visione automatica e al riconoscimento di forme e situazioni. L’uso di tecniche di analisi
tridimensionale (tessitura temporale) ha cos permesso di introdurre elementi di diagnosi
automatica in campo medico.
Da un altro punto di vista l’uso sempre piø diffuso di archivi di filmati richiede, come
gi detto, metodi automatici di ricerca che evitino la necessit di dover introdurre
manualmente tutte le informazioni riguardanti ogni filmato presente e tutti i possibili criteri di
ricerca. L’ausilio di tecniche automatiche di catalogazione e ricerca [3] (ad esempio basata
anche sull’uso della tessitura temporale) permette quindi una gestione piø efficace ed ottimale
(si evita la necessit di dover associare ad ogni filmato un file testuale contenente le
informazioni necessarie per la sua classificazione risparmiando cos spazio e tempo)
dell’archivio.
L’applicazione dei risultati delle ricerche sulla tessitura temporale pu essere suddivisa
in tre grandi aree: riconoscimento, segmentazione e sintesi. In fase di riconoscimento si
possono avere sistemi che concentrano la loro attenzione solo su alcuni tipi di tessitura
temporale e sistemi che invece sono in grado di riconoscere tutti i tipi classificati di tessitura
temporale. Per esempio, i sistemi di rilevamento di fumo e incendio sono basati sulle propriet
fisiche e chimiche del fumo. Tuttavia questi sistemi non sono adatti a monitorare vaste zone
aperte. Utilizzando invece un sistema in grado di riconoscere la presenza del fumo e del fuoco
effettuando l’analisi della tessitura temporale, si pu tenere sotto controllo una intera foresta
con una sola telecamera piazzata su un punto panoramico. Un altro esempio potrebbe essere
un sistema in grado di rilevare la presenza in mare di naufraghi o persone in difficolt .
Risulta evidente che questi sistemi scartano quei moti che non sono influenti
concentrandosi cos soltanto su alcuni. Ad esempio un sistema antifurto non Ł interessato al
6
fatto che i rami degli alberi si muovono. Ci fa si che si possano approfondire solo le
particolari tessiture temporali che interessano, ottenendo un dettaglio di analisi migliore.
L’analisi automatica degli archivi di filmati richiede invece che tutti i tipi di moto
vengano classificati ed individuati. Ci significa che c’Ł bisogno di sistemi di calcolo piø
potenti in grado di effettuare analisi piø complicate. Si pensi che spesso in ogni frame del
filmato sono presenti piø tipi di tessitura temporale e che tutti devono essere individuati e
riconosciuti.
La segmentazione consiste nell’individuare delle regioni statisticamente simili all’interno
di un filmato e raggrupparle. Tipicamente una segmentazione pu essere effettuata tramite una
analisi delle similitudini dei campi di flusso delle scene, come suggerito da Wang e Adelson
[4]. Questo tipo di analisi Ł molto complessa nel caso di scene tridimensionali (x,y,t) e per
questo motivo la segmentazione effettuata individuando le zone con lo stesso tipo di tessitura
temporale Ł piø semplice da effettuare. Un altro tipo di segmentazione si pu effettuare
analizzando solamente le informazioni temporali. Si riducono cos drasticamente i tempi di
analisi.
La segmentazione Ł molto utile in campo medico. Effettuando una tomografia
computerizzata (CT) o una risonanza magnetica (MRI) del cervello, si potrebbe effettuare una
misura del volume occupato dai vari tessuti o da un eventuale tumore. Un’altra applicazione Ł
la misura della robustezza delle ossa, effettuata analizzando una analisi CT ad alta risoluzione,
per diagnosticare la presenza di osteoporosi [5].
L’analisi della tessitura temporale permette di ricavare dei modelli che possono essere
usati anche per generare tessiture sintetiche. Queste tecniche sono molto sviluppate nella
grafica computerizzata. Le esplosioni presenti in tanti films di produzione moderna sono
realizzate sintetizzando la tessitura temporale del fuoco [6]. Le fasi della sintesi consistono
nell’usare un filmato campione per ricavare i dati caratteristici del modello (estrazione dei
parametri utili) e quindi sintetizzare utilizzando un processo inverso. ¨ quindi un processo
abbastanza semplice dove l’unica difficolt consiste nell’individuare un modello
sufficientemente dettagliato.
La sintesi potrebbe permettere in un prossimo futuro di generare un processo di
compressione dei filmati molto efficace. Per ogni tipo di tessitura temporale basta infatti
memorizzare i parametri caratteristici che in fase di decompressione vengono utilizzati per
sintetizzare le regioni (spaziali e temporali) precedentemente compresse.
7
1.2 Campi di ricerca
Lo studio della tessitura temporale Ł applicabile a diversi campi di ricerca. Quelli piø rilevanti
sono la visione automatica, l’elaborazione di immagini e la grafica computerizzata. Gli
obbiettivi di queste ricerche sono ovviamente diversi ma principalmente riguardano il
riconoscimento (visione automatica e sistemi di controllo), la rappresentazione (analisi con
modelli statistici per la predizione dei valori futuri) e la sintesi (generazione di tessiture
temporali artificiali).
1.2.1 Riconoscimento
La ricerca nel campo della visione automatica ha l’obbiettivo finale di realizzare un sistema di
riconoscimento in grado di operare senza l’intervento dell’uomo. Inizialmente si Ł basato il
riconoscimento degli oggetti su caratteristiche a basso livello come i contorni. La tessitura
temporale, invece, analizza scene nelle quali tali criteri di riconoscimento non
funzionerebbero. Infatti vi pu essere la presenza di molte piccole parti che si muovono
indipendentemente.
Nelson e Polana [1] basano il loro criterio di riconoscimento esclusivamente sul moto,
utilizzando il flusso ottico. Essi partono dal presupposto che i segnali visivi contengono piø
informazioni di quelle necessarie per il riconoscimento e che Ł possibile semplificare le
computazioni trascurando alcuni dati. Per esempio i loro dati di ingresso sono indipendenti da
alcune propriet ritenute irrilevanti come la luminosit e il colore. Questo tipo di analisi, una
volta individuato il flusso ottico, risulta intuitivo e di facile realizzazione ma ha lo svantaggio
di scartare troppe informazioni. Il risultato Ł che l’uso del flusso ottico Ł spesso poco accurato
per l’analisi della tessitura temporale, anche perchØ si basa sull’assunzione che vi sia
esclusivamente un moto traslatorio di oggetti. Ci implica che, al variare del tempo, i pixels di
una data regione si spostino senza cambiare la loro intensit , assunzione che Ł in generale non
Ł valida.
Nelson e Polana hanno aggiunto quattro caratteristiche in piø al flusso ottico in modo da
catturare maggiori informazioni. La prima caratteristica si ottiene dalla misura della non
uniformit direzionale considerando un istogramma che descrive l’ampiezza del moto in otto
direzioni e quindi la sua deviazione da una distribuzione uniforme. La seconda caratteristica Ł
una misura dei picchi della distribuzione di velocit che Ł l’ampiezza media del moto divisa
per la deviazione standard (conosciuta come coefficiente inverso di variazione). La terza
caratteristica descrive la distribuzione delle direzioni: viene calcolata una matrice delle
cooccorrenze dei moti nelle quattro direzioni ad un passo proporzionale all’ampiezza media
del moto, quindi per ogni direzione il numero delle coppie di pixels che hanno una direzione
8
di moto che differisce di uno Ł diviso per il numero di pixels che hanno una direzione di moto
che differisce per piø di uno. La quarta caratteristica Ł la divergenza media.
Una importante assunzione fatta da Nelson e Polana nell’applicazione del loro metodo di
riconoscimento Ł che l’immagine sia prima segmentata in regioni omogenee di tessitura
temporale. La segmentazione diventa quindi uno strumento utile ogni volta che si caratterizza
il moto degli oggetti con determinate estensioni spaziali. ¨ necessaria anche una
normalizzazione delle dimensioni dell’oggetto e della scala temporale del moto, se si vuole
procedere al confronto con altri moti di oggetti. Sebbene la segmentazione possa essere fatta
analizzando l’immagine staticamente, Ł consigliabile considerare le caratteristiche di moto per
una migliore e piø precisa segmentazione.
Una realizzazione della segmentazione e normalizzazione usando il moto Ł stata
proposta da Allen e Dyer [7]. Essi trovano delle curve spazio-temporali che sono tangenti al
flusso ottico di ogni frame. Intuitivamente tali curve tracciano la posizione di ogni punto nello
spazio e nel tempo. Tali curve possono essere calcolate direttamente dal flusso ottico usando
il metodo delle approssimazioni di Runge-Kutta per le equazioni differenziali. Tali curve
permettono di individuare tutti i punti di un oggetto in moto nel tempo poichØ i suoi punti
hanno una interdipendenza tra i loro moti. Per ogni curva viene calcolata la pendenza e la
curvatura e quindi tutti i punti con tali caratteristiche simili vengono raggruppati. Alla fine del
processo ogni gruppo corrisponde ad un oggetto. Una volta fatto ci per nasce il problema di
dover distinguere tra moti relativi e moti comuni degli oggetti. In pratica Ł difficile tracciare il
moto di questi punti nello spazio e nel tempo a causa del rumore e delle occlusioni e
sovrapposizioni di moti che possono avvenire.
Le curve spazio-temporali possono essere usate anche per caratterizzare i moti periodici.
Nelson e Polana [8] tracciano gli oggetti usando il centroide dei pixels in movimento nel
frame. La dimensione e la posizione dell’oggetto viene quindi normalizzata. Si individuano i
contorni dell’oggetto e si divide la regione in piccoli quadrati. Infine si somma l’ampiezza del
moto di ogni quadrato e si usa tale informazione come caratteristica. Se il moto Ł periodico,
l’ampiezza di moto di ogni cella avr un modello periodico. Per ogni cella quindi si calcola la
trasformata di Fourier e si misura il grado di periodicit e il periodo del moto. Si viene cos ad
associare ad ogni oggetto un vettore contenente tali informazioni e il riconoscimento degli
oggetti Ł realizzato usando criteri di matching.
Seitz e Dyer [9] suggeriscono di usare, per i moti ciclici, esclusivamente le informazioni
temporali. La variazione del periodo viene utilizzata per caratterizzare il moto e pu essere
descritta dal piø piccolo e dal piø lungo periodo ciclico, dalla accelerazione ciclica e dai punti
di irregolarit . Seitz e Dyer mostrano come determinare il periodo istantaneo che Ł l’intervallo
da un dato istante all’istante in cui il ciclo riassume la stessa fase. Se il punto di vista Ł fisso,
per determinare se la fase Ł la stessa in due frames, pu essere usata la differenza del valore
9
quadratico medio dell’intensit del pixel. Tale tecnica Ł stata applicata all’analisi delle
immagini radiografiche del cuore. Nel caso di immagini con telecamera in movimento pu
essere usata una funzione che permette di individuare un punto di vista invariante.
Altre tecniche di basso livello sono state utilizzate per l’analisi dei moti. Molte
informazioni possono essere estratte dalle curve spazio-temporali. Ad esempio le
discontinuit di tali curve e le loro derivate permettono di individuare dei cambiamenti di
direzione nel moto [10]. In altri casi come caratteristica si pu utilizzare l’energia del moto
spazio-temporale [11] [12].
1.2.2 Rappresentazione
Per l’analisi dei dati spaziali sono stati proposti molti modelli statistici. Tra questi solo pochi
sono stati estesi all’analisi di dati spazio-temporali. Di seguito ne vengono presentati alcuni,
maggiori informazioni si possono trovare in [13] [14] [15] [16].
I modelli autoregressivi sono stati spesso usati per l’analisi di dati spaziali e una delle
piø popolari versioni Ł l’autoregressione simultanea (SAR). Tali modelli trovano una
combinazione lineare tra un dato pixel e quelli in un suo intorno. In genere va considerato
anche un rumore bianco che si somma al modello. Se inoltre si considera un rumore che si
combina linearmente con tutti i valori dell’intorno allora si parla di modelli autoregressivi a
media mobile (ARMA).
Le varianti apportate a questi modelli permettono di aumentare il grado di precisione
nell’analisi compiuta. Mao e Jain [17] suggeriscono di costruire un modello SAR invariante
rispetto alla rotazione (RISAR). In questo modello l’intorno di ogni pixel Ł definito da un
cerchio e vengono presi in considerazione i valori medi dei pixels che servono per costruirlo.
Essi usano anche un modello multiregressivo (MSAR) nel quale per ogni pixel si considera
non un intorno ma piø intorni a differenti distanze. Sebbene essi non suggeriscano una tecnica
per la stima dei parametri, solitamente per intorni non casuali si applicala il calcolo dei
minimi quadrati [18].
I modelli ARMA sono stati generalizzati per dati spazio-temporali [19]. La
generalizzazione consiste nel considerare intorni spaziali e temporali. Per esempio Pfeifer e
Deutsch [20] hanno analizzato il numero di arresti in 14 distretti di Boston per 72 mesi tramite
il modello ARMA spazio-temporale. Gli autori identificano tale modello spazio-temporale
esaminando le funzioni di correlazione e di autocorrelazione parziale. I parametri sono stimati
usando l’algoritmo di ottimizzazione non lineare di Marqardt con una funzione di costo dei
minimi quadrati localmente linearizzata. Inoltre hanno analizzano la funzione di
autocorrelazione associata ad alcuni modelli di ordine basso [21]. Ogni intorno contiene solo
10
elementi temporalmente precedenti. In questo modo si garantisce la casualit dei dati e si
permette di creare degli intorni spazialmente simmetrici. Comunque Ł conveniente includere
anche dei dati dallo stesso instante di tempo e ci perchØ tali dati sono altamente correlati. Gli
autori usano intorni molto piccoli e con 1 o 2 parametri. Ci Ł probabilmente adeguato per i
dati che loro trattano ma nel caso di analisi di sequenze di immagini Ł necessario considerare
modelli piø complessi.
Heeger e Pentland [22] descrivono un modello frattale per flussi turbolenti. I frattali
sono caratterizzati da una semisomiglianza lungo una scala di profondit che determina la
dimensione frattale. Un esempio di fenomeno turbolento sono le nuvole. Gli autori applicano i
filtri di Gabor per determinare il parametro di scala frattale (che Ł collegato con la dimensione
frattale). Se tale parametro Ł consistente lungo differenti scale allora la regione in esame Ł di
tipo frattale. Con tale analisi anche la sintesi Ł possibile usando frattali Browniani. Alcune
sequenze sintetiche come lo scorrere delle nuvole o il fluttuare delle foglie degli alberi sono
state generate con i modelli frattali.
1.2.3 Sintesi
Nella grafica computerizzata due tessiture temporali di particolare interesse sono relative
all’acqua e al fuoco. Essi sono spesso usati nell’industria del cinema per gli effetti speciali e
dalle grandi case produttrici di software e simulatori sempre piø realistici [23], [24].
Perry e Picard [6] presentano un sistema per la sintesi del fuoco basato su poligoni
costituiti da triangoli con un vertice in comune, disposti in modo da costituire una superfice
ellittica irregolare. Ogni triangolo Ł ombreggiato con la tecnica di Gouraud e pu essere
semitrasparente. Una fiamma Ł costruita integrando la luce proveniente da una singola
particella su una traiettoria di 25 passi. Il colore, la trasparenza e la dimensione dei triangoli
cambia lungo il percorso. Per creare un forte realismo si considerano anche le correnti
convettive e la presenza del vento, oltre alle propriet dei materiali che stanno bruciando. La
tecnica delle particelle pu essere usata anche per altri fenomeni gassosi come il fumo e le
nuvole [25] [26].
Kung e Richards [27] sintetizzano l’acqua in movimento. La superficie dell’acqua Ł
modellata come un insieme di onde sinusoidali bidimensionali squadrate, considerando lente
variazioni nel periodo dell’onda. Il movimento Ł introdotto considerando, in istanti diversi,un
cambiamento di fase delle sinusoidi. Nel modello non Ł considerata la presenza del sole.
Invece la luce viene direttamente dal cielo che Ł considerato come una sorgente luminosa
emisferica. La funzione di refrattanza si basa essenzialmente sui termini di refrattanza di
Fresnel.
11
In generale si pu dire che un processo di sintesi della tessitura temporale consiste nel
considerare inizialmente la struttura, temporale e spaziale, dell’oggetto in esame e quindi
trasferire su tale struttura le propriet della tessitura temporale applicando i parametri ricavati
in fase di analisi. Fondamentalmente il problema della sintesi Ł che in fase di analisi, durante
l’estrazione dei parametri del modello, si Ł costretti, in base alle ipotesi di lavoro fatte, a
perdere delle informazioni. Tali informazioni perse ricoprono un ruolo fondamentale in fase di
sintesi ove, a partire dalle informazioni ricavate, si cerca di passare dai parametri del modello
teorico al modello reale aggiungendo le informazioni mancanti.
1.3 Metodi di analisi della tessitura
L’analisi della tessitura pu essere realizzata utilizzando diversi metodi che si possono tuttavia
suddividere in quattro grandi aree:
• approccio strutturale;
• approccio spettrale;
• approccio statistico;
• approccio neurale.
Sebbene tali metodi affrontino il problema a livelli diversi, storicamente i modelli
statistici sono quelli che hanno dato soluzioni migliori. Ci Ł dovuto al fatto che, pur restando
ad un alto livello di analisi, permettono di studiare a fondo le propriet intrinseche dei dati in
esame. In altre parole permettono una indagine piø accurata. Gli altri approcci (strutturali e
spettrali) vengono invece usati come complemento per estrarre ulteriori informazioni.
Ultimamente si Ł anche ricorso alle reti neurali per la loro capacit di analisi e
compressione delle informazioni associata ad una indagine flessibile dal punto di vista del
soddisfacimento dei vincoli.
In questa tesi si Ł sviluppato, per l’analisi della tessitura temporale, un modello statistico
al quale si Ł anche affiancato l’ausilio delle reti neurali. Tuttavia Ł preferibile esporre, in linee
generali, anche gli altri criteri di analisi.
Si osservi che in verit vi Ł anche un altro filone che sostiene che l’analisi della tessitura
temporale va eseguita cercando di capire come l’uomo riconosce la tessitura. Rao e Lohse [28]
identificano le tre dimensioni percettive piø importanti nella discriminazione di tessiture
naturali: la direzionalit , la periodicit , la granulosit . La teoria di scomposizione di Wold
[29] [30] scompone un campo casuale omogeneo in tre componenti mutuamente ortogonali.
Le caratteristiche percettive di tali componenti possono essere descritte come direzionalit ,
12
periodicit , granulosit . Tale scomposizione Ł stata applicata allo studio della tessitura da
Francos et al. [31] [32] [33] e, con alcune differenze, da Liu e Picard [34] [35].
1.3.1 Approccio strutturale
La tessitura viene caratterizzata in base alla sua struttura [36] [42] [43], partendo
dall’assunzione che essa sia costituita da primitive che appaiono posizionate all’interno di una
struttura spazialmente ordinata. Sebbene la piø semplice primitiva di una tessitura temporale
sia il pixel, si preferisce lavorare con le primitive di dimensione piø grande possibile, purchØ
sia sempre possibile scomporre la tessitura in un insieme di primitive aventi tutte le stesse
propriet . In genere la primitiva con cui si lavora Ł il texel. Quindi la disposizione dei texels
secondo alcune leggi casuali o deterministiche definisce un tipo di tessitura. Il texel pu essere
isolato identificando un gruppo di pixels che hanno una certa struttura invariante e che si
ripete nell’immagine.
Il texel pu essere definito dal colore, dalla forma o dalla omogeneit di alcune propriet
locali come la dimensione, l’orientamento o l’istogramma.
Si ricercano quindi le regole che determinano la disposizione dei texels nello spazio.
Queste relazioni spaziali possono essere espresse tramite l’adiacenza, la distanza, la
periodicit e cos via in caso di disposizione deterministica.
Nel caso di disposizioni casuali si usano altri criteri come la densit dei contorni,
l’estensione massima della regione, la densit media di pixels per unit di area.
Vi sono anche dei sistemi che utilizzano un approccio statistico-strutturale [37]. Si
basano sui modelli a mosaico [44]. Questi modelli sono caratterizzati da processi geometrici
casuali. Tali tessiture temporali sono sempre caratterizzate da una struttura primitiva ma la
disposizione di tali strutture nello spazio tridimensionale (spazio e tempo) e governata da
leggi statistiche. Si parla allora di interazione debole o forte tra le primitive e quindi di
tessitura temporale debole o forte. Tale distinzione si basa sull’analisi della frequenza con cui
ogni coppia di primitive cooccorre in una specifica relazione.
Per i modelli che hanno una certa regolarit nella disposizione delle primitive si Ł
sviluppato un modello grammaticale [45]. Le grammatiche permettono di costruire strutture
piø complesse a partire da alcune primitive utilizzando regole di combinazione.
Tale approccio Ł stato spesso usato per l’analisi della tessitura. Tuttavia applicarlo alle
tessiture temporali Ł molto piø complicato in quanto si lavora con modelli tridimensionali.
Inoltre il numero di dati da analizzare aumenta troppo per poter pensare a tempi di analisi
accettabili con le risorte attualmente disponibili. Tale approccio viene invece talvolta usato in
13
fase di sintesi ove, una volta individuata la primitiva, si tratta solo di posizionarla nello
spazio.
1.3.2 Approccio spettrale
La tessitura viene descritta partendo dall analisi dell immagine nel dominio delle frequenze
spaziali.
Data una immagine
fxy(, ) con xy N,,.,= −01 1
la trasformata discreta di Fourier (DFT) permette di studiare tale immagine nel dominio delle
frequenze spaziali u e v:
Fuv
NN
fxy e
j
ux
N
vy
N
y
N
x
N
(, ) (, )=
⋅
⋅
−+
=
−
=
−
∑∑
1
2
0
1
0
1
π
ove xyuv N,,, ,,.,=−01 1
L’analisi della trasformata Ł permette di individuare delle componenti periodiche o
semiperiodiche che nel dominio dello spazio sono difficilmente riscontrabili. Analizzando
invece lo spettro in frequenza Fuv(,), che essendo fxy(, ) reale Ł simmetrico positivamente
rispetto all’origine, Ł possibile individuare dei picchi ad alta energia che permettono di
caratterizzare l’immagine.
In particolare sono tre gli usi tipici della DFT:
• individuazione dei picchi principali dello spettro;
• identificazione sull’asse delle frequenze di tali picchi ai fini della classificazione;
• eventuale rimozione dallo spettro di componenti periodiche, mediante l’uso di opportuni
filtri, in modo che le immagini cos trattate siano analizzabili con leggi statistiche.
Ad ogni componente periodica dell’immagine corrisponde, nel piano delle frequenze, un
picco.
L’interpretazione delle caratteristiche dello spettro pu essere semplificata lavorando in
coordinate (r, θ ). Una ulteriore semplificazione si pu effettuare considerando la trasformata
S(r, θ ) come funzione di r e di Sr
θ
( ) per ogni direzione θ . Analogo discorso si pu fare
14
considerando S(r, θ ) come funzione di θ e di S
r
()θ per ogni valore di r. Analizzando Sr
θ
()
per un valore di θ , si ottiene il comportamento dello spettro lungo una direzione radiale
passante per l origine. Analogamente con S
r
()θ , per ogni valore r, si ottiene il
comportamento dello spettro lungo un cerchio centrato nell origine e di raggio r.
La ricerca dei picchi armonici dello spettro si ottiene analizzando Sr
θ
( ) per piø valori
di θ . Tali picchi sono i massimi dello spettro le cui frequenze sono fondamentali o armoniche.
Una frequenza si dice fondamentale se i massimi corrispondenti sono a valori di frequenza
ottenuti combinando linearmente tale frequenza fondamentale. La combinazione lineare delle
frequenze fondamentali genera invece una frequenza armonica.
Per la ricerca dei picchi armonici basta allora cercare i massimi della funzione
unidimensionale Sr
θ
( ) , fissato θ, in corrispondenza alle frequenze armoniche o fondamentali.
Integrando (o meglio, sommando dato che in questo caso le variabili sono discrete) le
funzioni Sr
θ
() e S
r
()θ rispetto a θ e a r, negli intervalli [0, π ] e [1, R], si ottiene una
descrizione piø globale della tessitura. Risulta
Sr S r() ()=
=
∑
θ
θ
π
0
e
SS
r
r
R
() ()θθ=
=
∑
1
Tali funzioni unidimensionali costituiscono, al variare di r e di θ , una descrizione globale
dello spettro della tessitura dell’immagine in esame.
Si possono poi identificare in tali funzioni dei descrittori come la posizione del valore
piø alto, la media e la varianza delle ampiezze, le variazioni assiali e la distanza tra la media e
il valore massimo.
Dagli studi compiuti utilizzando diversi criteri di analisi [38] si Ł potuto constatare che
gli approcci spettrali sono in genere meno potenti rispetto ai metodi statistici. Tuttavia in certi
casi l’analisi spettrale consente di ottenere una maggiore accuratezza e precisione in fase di
riconoscimento e classificazione.
La Figura 3 mostra come la DFT del valore medio dei valori dei pixels al variare del
tempo, di due regioni all’interno di una stessa tessitura temporale, non permetta di individuare
le caratteristiche proprie della sequenza in esame a causa della grande variabilit del modulo
dello spettro quando si sposta il punto di osservazione.
15
Figura 3: la FFT temporale del valore medio dei pixels di una regione calcolata in due differenti punti di una stessa tessitura temporale.
1.3.3 Approccio statistico
Le tessiture naturali di tipo casuale si prestano bene ad essere analizzate con questo approccio.
Una analisi elementare pu essere effettuata osservando l’istogramma della immagine.
Le prime informazioni si possono ricavare dal valor medio che risulta
m
in
n
i
i
L
=
⋅
=
−
∑
0
1
ove i Ł il livello di grigio che si sta considerando, n
i
Ł il numero di pixels di valore i presenti
nell’immagine, L il numero totale di livelli ed n il numero totale di pixels. Ulteriori
informazioni provengono dai momenti statistici. In genere si considerano i primi tre momenti
ma talvolta si ricavano anche il quarto e il quinto. La definizione per il momento n-esimo Ł
µ
N
N
i
L
i
im
n
n
=−⋅
=
−
∑
()
0
1
ove N indica l’ordine del momento.
16
Il momento secondo ( σ
2
, o varianza), indica il tasso di crescita della curva attorno al
valore medio, mentre il terzo momento ci da informazioni sulla disposizione della curva
stessa attorno a m e sulla presenza, quindi, di eventuali simmetrie o dissimmetrie.
L uso esclusivo di questi descrittori tuttavia non permette di descrivere totalmente una
tessitura. ¨ stato infatti provato che tessiture con stessi valori di m, σ
2
e µ
3
risultano
differenti all’occhio umano.
Gli studi condotti da Julesz [39] provano che la distribuzione di probabilit del secondo
ordine Ł una caratteristica fondamentale usata dall’occhio umano per discriminare differenti
tessiture. Tamura et al [40] provano che il suo valore fornisce informazioni sulla regolarit e
sul contrasto dell’immagine − cioŁ la dispersione dei livelli di grigio attorno al valore medio − .
Successivamente per Julesz [41] si Ł accorto che alcuni tipi di tessitura, pur avendo la
stessa varianza, sono facilmente discriminabili dall’occhio umano.
Altre informazioni possono essere ricavate dalla funzione di autocorrelazione (ACF) che
permette di ricavare informazioni sulla grossolanit della tessitura. La sua espressione, per
immagini bidimensionali, Ł
ρ (,)
(, ) ( , )
(, )
∆∆
∆∆
∆
∆
xy
fxy fx y
fxy
xy
y
Ny y
x
Nx
y
N
x
N
x
y
x
=
⋅+ +
=
−
=
−
==
∑∑
∑∑
11
2
11
ove N
x
e N
y
sono le dimensioni dell immagine in x e y.
I criteri sin qui descritti sono ovviamente la base di partenza per lo studio della tessitura.
Vari studiosi hanno cercato di risolvere il problema modificando le formule qui viste ed
aggiungendone altre in modo da poter estrarre piø informazioni possibili da ogni tipo di
tessitura. Tuttavia ancora non Ł stato trovato un criterio che sia in grado di identificare in
modo univoco i vari tipi di immagini.
In questa tesi si Ł cercato di analizzare la tessitura temporale mediante dei modelli
autoregressivi (AutoRegressive). Essi si prestano bene all’analisi di dati spaziali. Questi
modelli esprimono un legame lineare tra un punto e quelli contenuti in un suo intorno. A tale
legame Ł aggiunto un rumore bianco che introduce un fattore di incertezza nella
determinazione del legame. Inizialmente tali modelli sono nati per analizzare delle serie
temporali monodimensionali. L’espressione del modello autoregressivo Ł
ff a
i
i
p
() ( ) ()xxxx
i
=++
=
∑
φ ∆
1