2
a partire da tali ipotesi erano stati sviluppati i modelli di traffico e su tali modelli era
basato lo sviluppo ed il progetto di reti e di servizi su rete.
Al classico traffico vocale si è affiancato, già da diversi anni (e, col passare
del tempo, in maniera sempre più massiccia), un traffico costituito dalla trasmissione
di dati, dovuto all'impiego della rete per una serie di servizi che vanno dall'invio di
fax alla videotelefonia, dall’interconnessione di reti locali all'accesso di utenti remoti
ad Internet; è, inoltre, fervente un’attività di ricerca, tesa ad estrarre dalle analisi sulla
realtà delle reti di comunicazione alcuni modelli per le singole sorgenti o per il
traffico a vari livelli di aggregazione, risultante dalla multiplazione di più sorgenti. Da
questi studi è apparsa evidente la discrepanza tra un sistema, pensato e sviluppato su
modelli di sorgente e di traffico di tipo semplice (traffico telefonico), e la realtà di ciò
che ora transita in quel sistema: il sospetto che il modello di Poisson, fino ad ora
adottato per caratterizzare il traffico nelle reti, fosse inadeguato, ha trovato conferma
nell'ultimo decennio grazie alla mole di dati risultanti dalle misure su traffico relativo
a Local-Area Network (LAN) [2] e Wide-Area Network (WAN) [3].
Si è così avuta una conferma sperimentale di ciò che si sospettava già da
tempo: su traffico reale è presente in un ampio spettro di scale temporali una
significante variabilità; ovvero il traffico dati ha una caratteristica esplosività,
burstiness, anche su scale temporali maggiori di quelle che i tradizionali modelli
statistici possano giustificare e che dipende da numerosi fattori. Tale caratteristica
può essere dovuta alla natura specifica di ciò che si trasmette come pure al fattore
umano, vale a dire alle peculiarità dell'operatore, ma comunque è una caratteristica
diffusa, che si conserva al variare della scala temporale alla quale si osserva il
fenomeno e che non trova però riscontro nei modelli fino ad ora adoperati per
caratterizzare il traffico nelle reti: infatti, se è vero che il modello di Poisson genera
un traffico impulsivo (bursty), se osservato su scale dell'ordine dei millisecondi, è
altresì vero che, al crescere della scala, questa caratteristica si perde dato che i picchi
tendono ad essere smussati da un’operazione di media su una scala adeguatamente
lunga [2].
3
Il traffico caratterizzato da picchi su parecchie o su tutte le scale temporali
può, invece, essere efficacemente descritto statisticamente, usando la definizione di
self-similarity (auto-similarità), una proprietà tipicamente associata ai frattali, oggetti
che appaiono essere gli stessi a dispetto della scala su cui sono visualizzati.
Figura 1.1: Traffico misurato in una rete Ethernet (a
sinistra), tracce generate mediante un modello
classico (al centro) e mediante un modello self-
similar (a destra), per differenti livelli di
aggregazione. I tratti evidenziati in ogni grafico
sono quelli rappresentati, in scala espansa, nel
grafico successivo.
4
Nel caso di grandezze aleatorie, come le serie temporali, la self-similarity va
considerata in senso distribuzionale: il processo, anche se aggregato presenta le stesse
caratteristiche da un punto di vista stocastico, a patto di un’opportuna
normalizzazione.
Dato che un processo self-similar contiene picchi osservabili su tutte le scale
temporali, esso esibisce una memoria di tipo long range; i valori ad ogni istante sono
fortemente correlati con valori, anche lontani, di istanti passati. L’importanza della
dipendenza long-range nel traffico di rete è stata osservata in studi [4] che mostrano
che la perdita di pacchetti e l’andamento dei ritardi è radicalmente differente nelle
simulazioni utilizzanti traffico reale rispetto a quelle che utilizzano modelli di traffico
tradizionali. Tuttavia le ragioni che stanno dietro la self-similarity nel traffico di rete
non sono state chiaramente identificate sebbene siano state avanzate diverse ipotesi.
§ 1.2 Definizione di self-similarity
Consideriamo una serie discreta Y(t) che rappresenta il volume totale di
traffico misurato in pacchetti all’istante t a partire da un instante di riferimento che
indicheremo come istante 0. Si indichi con X(t) il relativo processo incrementale,
ovvero il rate del traffico aggregato all’istante t. Assumeremo nel prosieguo della
trattazione X(t) stazionario.
Se indichiamo con ϑ la funzione di autocovarianza e con ς
la varianza, X(t)
è esattamente Self-Similar del secondo ordine con parametro di Hurst H (1/2<H<1) se
))1(2)1((
2
)(
222 HHH
kkkk
ς
ϑ
Detta )(
)(
k
m
ϑ l’autocorrelazione del processo aggregato su una scala di m
campioni
ƒ
mi
imt
m
tX
m
iX
1)1(
)(
)(
1
)(
X(t) è asintoticamente Self-Similar del secondo ordine con parametro di
Hurst H se
5
))1(2)1((
2
)(lim
222)( HHHm
m
kkkk
φ ο
ς
ϑ
E’ possibile dimostrare che la Self-Similarity esatta del secondo ordine
implica che ϑ(k)= ϑ
(m)
(k) per 1 τm .
Y(t) è Self-Similar con parametro di Hurst H (0<H<1) se:
)()( atYatY
H
d
dove l’uguaglianza è intesa in senso distribuzionale.
Si può dimostrare che se Y(t) è Self-Similar allora X(t) è esattamente Self-
Similar del secondo ordine. Il viceversa è vero se X(t) è Gaussiano.
Il parametro H quantifica il grado di self-similarity: per 1 οH il grado di
self-similarity aumenta cosicché il test fondamentale per una serie self-similar si
riduce a stimare quanto H si discosta significativamente da 1/2.
§ 1.3 Self-similarity e frattali
Come si è visto, una caratteristica importante della self-similarity è costituita
dalla legge di riduzione su diverse scale temporali (scaling law), proprietà in genere
associata ai frattali, in base alla quale un oggetto appare identico a se stesso
indipendentemente dalla scala alla quale è osservato. Ciò significa che due serie
numeriche ottenute dal campionamento dello stesso fenomeno, con differenti
frequenze di campionamento, possono essere manipolate in modo tale da apparire
uguali. La manipolazione in questione riguarda il fatto che bisogna ridurre l’ampiezza
delle serie relative a frequenze di campionamento superiori.
6
§ 1.3.1 Fractal dimension
La "fractal dimension" d di un oggetto è definita da
Κ
1
ln
ln N
d
dove N è il numero di oggetti self-similar (versioni di se stesso) che copre
una data dimensione d dell'oggetto e dove Κ è la scala lineare della dimensione degli
oggetti coperti.
In contrasto con quello che succede per i processi SRD (che sono
caratterizzati da un indice d = 1), i processi self-similar possono essere pensati come
processi con "fractal dimension" frazionario (ovvero d ha la forma d= xx.yy...).
Questa è la diretta conseguenza della lenta convergenza del processo ai suoi valori
medi.
§ 1.4 Long range dependence
Sia r(k)= ϑ(k)/ ς
2
la funzione di autocorrelazione del processo X.
X(k) è long range dependent (LRD) se:
r(k) ~ ck
- Ε
, quando φ οk con 10 Ε e c>0
la funzione di autocorrelazione non è quindi sommabile ovvero:
ƒ
φ
φ
φ ο
k
kr )(
Al contrario, un processo SRD (Short Range Dependence) ha una funzione
di autocovarianza che decresce esponenzialmente.
7
k
akr ~)(
quando
φ οk
e 10 a .
la funzione di autocorrelazione di un processo SRD è quindi sommabile. La
funzione di autocorrelazione di un processo LRD tende a zero in maniera più lenta
rispetto alla funzione di autocorrelazione di un processo SRD.
In conclusione è possibile affermare che, benché i singoli valori di r(k)
tendano a zero al divergere di k, il loro effetto cumulativo è divergente nel caso di
processi LRD, che, pertanto, hanno caratteristiche drasticamente differenti rispetto ai
processi SRD.
Dalla definizione segue che la densità spettrale di un processo LRD diverge
per basse frequenze in contrasto con quanto succede per i processi SRD, la cui densità
spettrale rimane pressoché costante per piccoli valori della frequenza. In altre parole,
la densità spettrale di un processo LRD mostra un comportamento nei pressi
dell'origine di tipo
ϑ
w
wS
1
)( ϖ
per 0 οw
con il parametro ϑ legato a Ε da
Ε ϑ 1
La manifestazione nel dominio della frequenza di un processo LRD è
indicata come rumore di tipo 1/f (1/f noise).
8
§ 1.5 Relazione tra Self-Similarity e Long Range
Dependance
Per quanto detto precedentemente è chiaro che esistono processi self-similar
che non hanno la proprietà di essere LRD e viceversa. Per esempio, il Brownian
motion è self-similar con H=1/2 ed i suoi incrementi sono di tipo Gaussian Noise ma
quest’ultimi non sono LRD.
Di contro le serie FARIMA sono LRD ma non sono self-similar.
Tuttavia nel caso di self-similarity asintotica del secondo ordine se è valida
la restrizione 1/2<H<1 si dimostra che la self-similarity implica la Long-range
dependance e viceversa.
In particolare l’autocorrelazione di un processo LRD può essere espressa in
funzione del parametro di Hurst
22
)12(~)(
H
kHHkr con φ οk
e la densità spettrale come
12
1
)(
ϖ
H
w
wS
quindi la relazione tra Ε, ϑe il parametro di Hurst è
121 HΕ ϑ
L’equivalenza tra self-similarity asintotica del secondo ordine e long range
dependance è il motivo per cui in letteratura spesso i due termini self-similarity e
long-range dependance siano stati utilizzati tout court in modo interscambiabile.
Anche in questo lavoro si adotterà questa convenzione.
9
§ 1.6 Altre proprietà dei processi LRD
In questa sezione vengono descritte due proprietà dei processi LRD che
storicamente sono state tra le prime osservate in processi naturali a memoria lunga.
§ 1.6.1 Proprietà di varianza lentamente decrescente
Per processi LRD, la varianza dei processi aggregati decresce molto più
lentamente del reciproco di m, dove m indica la dimensione dell'aggregato.
> ≅
Ε
ϖmX
m)(
var
per valori sufficientemente grandi di m, con 10 Ε .
D'altro canto, nel caso di un processo SRD il parametro Ε è uguale ad uno e
> ≅
1)(
var
ϖmX
m
La proprietà di varianza lentamente decrescente ("slowly-decaying variance
property") può essere facilmente rilevata diagrammando > ≅
)(
var
m
X su m in un
diagramma logaritmico: una retta con una pendenza negativa minore dell'unità,
rilevabile su un ampio intervallo di valori, indica che la varianza decresce lentamente.
Una seria conseguenza della proprietà di varianza lentamente decrescente è
quella che, nel caso di test statistici classici (come il calcolo di intervello di
confidenza), le misure usuali della deviazione standard ς diventano poco efficaci
all'aumentare della dimensione degli aggregati in quanto, il numero di campioni della
serie aggregata diventa insufficiente per il test statistico.