1. INTRODUZIONE
La comunicazione fra due calcolatori comporta sempre la codifica dei dati e il
trasferimento di energia (ottica o elettromagnetica) lungo un canale di trasmissione. In
generale nei sistemi di trasmissione dati si effettuano tipicamente tre diversi tipi di codifica :
• codifica di sorgente
• codifica di canale
• codifica di linea
una sorgente discreta emette messaggi costituiti da simboli appartenenti ad un insieme finito (
es. 2 simboli in caso di sorgenti binarie) di simboli detto alfabeto della sorgente,
caratterizzato da una particolare distribuzione statistica. Una sorgente è caratterizzata da una
grandezza chiamata Entropia , che misura l'informazione media. Scopo della codifica di
sorgente è quello di trasformare i messaggi nativi emessi dalla sorgente in altre
rappresentazioni in modo da ridurre la velocità media di trasmissione dell'informazione
cercando di renderla più vicina possibile all'Entropia. In pratica data la particolare
distribuzione statistica dei simboli o dei valori emessi dalla sorgente, si utilizzano meno bit
per rappresentare i simboli più frequenti di altri.
Con la codifica di canale , si introduce una ridondanza nella sequenza trasmessa, inviando più
simboli di quanti non ne produca la sorgente, e quindi di fatto aumentando il numero di
simboli da trasmettere per unità di tempo; attraverso una opportuna strutturazione della
sequenza dei simboli trasmessi, è possibile, in ricezione, rivelare la presenza di errori o,
ancora meglio, correggerne fino a un numero prefissato, dipendente dalle caratteristiche del
codice. Nel caso di semplice individuazione degli errori il ricevitore può semplicemente
richiedere la ritrasmissione del simbolo errato (strategia ARQ).
La codifica di linea , oggetto dello studio del presente lavoro, ha lo scopo di associare al
messaggio discreto emesso dalla sorgente un insieme di forme d'onda impulsive tali
da ottimizzare la trasmissione sul particolare mezzo trasmissivo Il termine trae origine
nella telefonia con la necessità di trasmettere segnali digitali su una linea telefonica in rame.
Comunque il concetto di codice di linea si applica ad ogni canale di trasmissione. Differenti
caratteristiche del canale , così come diversi tipi di applicazione e richiesta di requisiti ha
fornito l'impulso per lo sviluppo e lo studio di tantissimi formati di codice di linea. Per
esempio, un canale potrebbe avere un accoppiamento a.c. e quindi non tollerare una
componente d.c. Sincronizzazione e ricostruzione della temporizzazione possono essere
requisiti fondamentali per la ricostruzione del segnale in ricezione. Altre caratteristiche di un
codice di linea possono riguardare la complessità e l'economicità del sistema di codifica e
decodifica, la possibilità di monitoraggio delle performance , l'affidabilità attraverso un
controllo della probabilità d'errore, la trasparenza, ma probabilmente l'aspetto principale
riguarda la distribuzione spettrale di potenza che deve essere sufficientemente piccola in
confronto alla banda passante del canale al fine di evitare interferenze e distorsioni tra cui una
delle principali è rappresentata dall'interferenza intersimbolica.
In pratica la funzione di trasferimento del canale si comporta male ai limiti della banda,
pertanto la codifica di linea deve sagomare il segnale in modo da concentrare la maggior
potenza trasmessa a centro e tale risultato può ottenuto attraverso una particolare scelta
dell'andamento temporale della forma d'onda che rappresenta l'impulso e nel caso di codifica
con memoria, introducendo una correlazione tra i simboli trasmessi.
Obiettivo della presente tesi è proprio quello di definire un modello matematico che consenta
di calcolare in forma analitica la densità spettrale di potenza delle varie codifiche principali
con particolare riferimento alle reti di computer, e di elaborare un modello di simulazione di
tipo Monte Carlo, cioè basato sui numeri casuali, per la verifica sperimentale dei risultati
01
ottenuti e per la stima spettrale di sistemi di codifica complessi che non possono essere
descritti dal modello matematico definito.
I segnali che vengono esaminati rappresentano processi casuali che supponiamo stazionari
ed ergodici; ricordiamo che un segnale aleatorio è detto “stazionario” se i suoi parametri
statistici sono invarianti rispetto al tempo. Questo implica che media e varianza non
dipendano dal tempo, mentre la funzione di autocorrelazione R(t
1
,t
2
) dipenderà solo dalla
differenza tra i tempi (t
2
-t
1
) .
Un segnale stazionario può essere ergodico. Questa condizione si verifica quando tutti i
parametri statistici che lo caratterizzano possono essere ottenuti considerando un unico
elemento, scelto a caso all’interno dell’insieme statistico. In questo caso la media sugli
insiemi può essere sostituita da una media sul tempo. Questa proprietà ci consente di
utilizzare lunghe sequenze casuali di segnale per ricavare le proprietà statistiche utili al nostro
modello di simulazione.
E' noto che solamente un segnale random la cui ampiezza può essere prevista con probabilità
0< p <1 contiene informazione. I casi estremi riguardano da un lato il rumore bianco i cui
valori sono totalmente non correlati (densità spettrale di potenza costante) e dall'altro lato un
segnale deterministico periodico i cui valori sono noti in ogni istante del tempo con
probabilità p=1.
I segnali che rappresentano le codifiche di linea che studieremo sono processi casuali discreti
nel tempo e in ampiezza. Saranno presi in considerazione codifiche di linea binarie , pseudo-
ternarie, bifasi,etc. con simboli non correlati e simboli correlati. Nel caso di simboli non
correlati, cosiddette codifiche istantanee, il calcolo della PSD non presenta eccessive
difficoltà, mentre è molto difficile calcolare la densità spettrale nel caso di codifiche, quali
AMI-NRZ o MLT3, che presentano impulsi con ampiezza casuale e correlazione tra impulsi
particolari. Questo è uno degli argomenti sviluppati nella presente tesi .
Vi sono diversi metodi di stima della densità spettrale di potenza; il metodo che si è utilizzato
in questo caso e’ quello che si basa sulla trasformata discreta di Fourier della funzione di
autocorrelazione. Com’è noto lo spettro di potenza di un processo aleatorio stazionario e’
matematicamente legato alla sequenza di autocorrelazione dalla DFT (Discrete-time Fourier
Transform). Utilizzando come ambiente di sviluppo MATLAB , si è sviluppato un particolare
algoritmo per il calcolo della funzione di autocorrelazione R(τ); si è quindi proceduto ad una
operazione di finestratura attraverso cui si è definito l'intervallo di osservazione della funzione
di autocorrelazione determinando la funzione troncata R
Δ
(τ) ; successivamente mediante una
operazione di interpolazione lineare si è realizzato un campionamento e aggiunto un certo
numero di zeri per il successivo calcolo della trasformata discreta di Fourier che viene
effettuata in modo molto efficiente mediante l'algoritmo FFT (Fast Fourier Transform) che
riduce la complessità di calcolo da O(N
2
) a O(N log
2
N).
02
CAPITOLO 2 DESCRIZIONE CODICI DI LINEA
In questa parte viene effettuato lo studio analitico delle varie codifiche di linea sulla base dei
risultai ottenuti nell'appendice A, in cui saranno illustrati in forma sintetica i concetti
fondamentali relativi all'analisi spettrali dei segnali deterministici ed aleatori, all'esame della
probabilità d'errore e alle catene di Markov del primo ordine , essenziali per lo sviluppo del
presente lavoro di tesi. Si esamineranno le varie forme di segnali binari di linea che possono
essere sostanzialmente di due tipi : di livello e di transizione. I primi portano l’informazione
nel livello di ampiezza (valore della tensione) i secondi invece nel cambiamento della forma
d’onda. Inoltre i codici di linea possono essere raggruppati in bipolari e unipolari a seconda
dell’ampiezza presentata rispetto all’asse di riferimento.
Sulla base dei concetti introdotti nello studio del ricevitore ottimo di cui al punto A.5 , si
valuterà la performance della particolare codifica con riferimento alla probabilità d'errore. Si
prenderanno in considerazione le codifiche binarie di base , bifasi, pseudo-ternarie e multi-
livello e a blocchi. In particolare si farà riferimento alle principali codifiche di linea
impiegate nelle LAN e che sono : NRZ, RZ , Manchester, NRZI, MLT-3, nBmB, codifiche
multilivello tipo 8B6T, PAM5.
Nella tabella seguente vengono elencate le caratteristiche del livello fisico di IEEE 802.3 :
Standard Mezzo fisico utilizzato Utilizzo L. Max Codifica
Fisica
10BASE5 Coassiale Thick (cavo giallo) 500 m Manchester
10BASE2 Coassiale Thin (cavo giallo) 185 m Manchester
10BASE-T Doppino attorcigliato non schermato 1 coppia 100 m Manchester
10BASE-F Fibra ottica multimodale (62.5/125) 2000 m Manchester
100BASE-T4 Doppino attorcigliato non schermato cat 3 o sup. 4 coppie 100 m 8B6T (125
MHz)
100BASE-T2 Doppino attorcigliato non schermato cat 3 o sup. 2 coppie 100 m PAM 5x5
100BASE-TX Doppino attorcigliato non schermato cat 5 o
schermato
4 coppie 100 m 4B5B (125
MHz)
NRZI
100BASE-FX Fibra ottica multimodale (62.5/125) 2 fibre 2000 m 4B5B (125
MHz)
1000BASE-CX
(Copper short
range)
Doppino attorcigliato schermato bilanciato 150 Ω 2 coppie 25 m 8B10B
1000BASE-SX
short
wavelength
Fibra ottica multimodale (50/125 – 850 nm)
Fibra ottica multimodale (62.5/125 – 850 nm)
2 fibre
2 fibre
500 m
275 m
8B10B
1000BASE-LX
long
wavelength
Fibra ottica multimodale (50/125 – 1310 nm)
Fibra ottica multimodale (62.5/125 – 1310 nm)
Fibra ottica monomodale (9/125 – 1310 nm)
2 fibre
2 fibre
550 m
550 m
5000 m
8B10B
10GBASE-SR Fibra ottica multimodale (50/125 – 850 nm)
Fibra ottica multimodale (62.5/125 – 850 nm)
66-300 m
26-33 m
64B/66B
10GBASE-LR Fibra ottica monomodale (10/125 – 1310 nm) 10 km 64B/66B
10GBASE-ER Fibra ottica monomodale (10/125 – 1310 nm) 40 km 64B/66B
2.1.Codifiche binarie di base
Una prima basilare classificazione dei codici è quella di dividerli nelle due principali classi
:Non-Return-to-Zero (NRZ) e Return-to-Zero (RZ). Tali codici possono inoltre essere polari
se due livelli {-A,+A} dell'ampiezza dell'impulso sono utilizzati per distinguere i simboli
03
binari {0,1} emessi dalla sorgente oppure unipolari se si sostituisce al livello più basso il
livello 0. Per una sequenza binaria distribuita uniformemente con probabilità di simbolo pari
ad
1
2
si avrà ,nel formato unipolare, un valor medio che rappresenta una componenete dc
pari a
A
2
non presente nel caso polare.
La codifica più semplice consiste nell'associare a ciascun bit un valore stabile per la sua intera
durata. Tale codifica prende il nome di NRZ , ed è equivalente alla rappresentazione in
termini di zeri e uni.
Ai fini della trasmissione, le principali caratteristiche di una codifica si stabiliscono in base ai
due casi estremi di massimo e minimo numero di transizioni generate nell'unità di tempo.
Il minimo numero di transizioni nell'unità di tempo determina la
possibilità di sincronizzazione del ricevitore. Nel caso della codifica NRZ una sequenza di
valori uguali non genera alcuna transizione, e, pertanto, risulta impossibile garantire la
corretta sincronizzazione. Questo problema viene aggirato ricodificando e allungando le
sequenze di bit da trasmettere in modo da garantire sempre, in funzione della codifica sul
mezzo fisico, un certo numero minimo di transizioni. Esempi di tali codifiche sono 4B5B,
5B6B utilizzata nello standard 802.3 per la trasmissione a 100 Mb/s su cavo in rame a due e a
quattro coppie e su fibra. Nel caso di una sequenza alternata di 0/1 si determina la frequenza
fondamentale dell’onda quadra, frequenza che contiene il maggior contributo di potenza.
Si esamineranno per via analitica e successivamente mediante simulazione al computer i
seguenti codici NRZ di tipo unipolare e polare: NRZ-Unipolare , NRZ-L-Polare , NRZ-I-
Polare nelle due sue possibili realizzazioni che sono NRZ-M, NRZ-S. La perdita
dell'informazione di temporizzazione dei formati NRZ può essere risolto introducendo più
transizioni. Questo porta ai formati RZ. Comunque l'ampiezza di banda di un formato RZ è
maggiore di quella del formato NRZ Si esamineranno due formati RZ: il formato unipolare in
cui un bit 1 è rappresentato da un impulso positivo per metà periodo di bit e 0 per il
successivo mezzo periodo e il formato polare in cui i simboli 1 e 0 sono rappresentati da un
impulso rispettivamente positivo e negativo pari a mezzo periodo. Questo codice assicura due
transizioni per bit e non presenta componente continua.
2.1.1 Codice NRZ-U.
Non-Return-to Zero-U è il codice unipolare più semplice in cui un simbolo binario 1 è
rappresentato da un livello di tensione diverso da 0 e un simbolo 0 è rappresentato da un
livello di tensione pari a 0.Questo è un codice istantaneo, cioè con i simboli non correlati.
La forma d'onda che rappresenta il simbolo è un impulso rettangolare che possiamo vedere
rappresentato nella figura. A.1 e la cui trasformata di Fourier è indicata nella A.2. Con
riferimento alla figura A.6 , supporremo la sequenza {b
n
}={0,1} un processo casuale ergodico
con probabilità dei simboli p
s
(0)= p
s
(1)=½, cioè considereremo i simboli di sorgente
equiprobabili. Il processo casuale {a
n
}={0,1}, all'uscita del codificatore di linea, è
caratterizzato da simboli equiprobabili, non correlati (modulatore privo di memoria) con
valore medio e varianza dati dai seguenti valori:
e introducendo tali valori calcolati nella A.13 e considerando anche la A.2 otteniamo:
m
a
=1
1
2
+0
1
2
=
1
2
σ
a
2
=(1−
1
2
)
2
1
2
+(0−
1
2
)
2
1
2
=
1
4
∣G( f)∣
2
=T
2
(sin
π fT
π fT
)
2
04