Introduzione
2
lossless) non permette di ottenere rapporti di compressione suffi-
cientemente alti, per cui la loro applicazione non risulta convenien-
te. Per questo tutti i sistemi di codifica video introducono delle per-
dite (codifica lossy) che hanno lo scopo di ridurre la banda del se-
gnale a valori accettabili per la sua trasmissione. Queste perdite
causano inevitabilmente degli artefatti che possono pregiudicare la
qualità della sequenza stessa. Emerge così il problema della valuta-
zione della qualità per una sequenza codecodificata.
In questo lavoro di tesi sarà esaminato il caso di codifica MPEG-2 a
bit rate costante. Ovviamente la qualità ottenuta per una sequenza
dipenderà dal bit rate di codifica e migliorerà con l’aumentare di
quest’ultimo; il bit rate di codifica “ottimale” sarà fortemente con-
dizionato dalle caratteristiche di dettaglio spaziale e di movimento
della sequenza stessa.
Attualmente la valutazione della qualità di una sequenza è fatta at-
traverso metodi soggettivi, basati sul giudizio di alcuni gruppi di os-
servatori. Questi metodi, oltre ad essere costosi e poco affidabili,
non permettono una valutazione in tempo reale della qualità.
L’uso di metodi oggettivi ed automatici, invece, consentirebbe un
monitoraggio continuo della qualità, permettendo una tempestiva
correzione di parametri di codifica.
Il presente lavoro di tesi si inserisce nell’ambito di una collabora-
zione tra il Consorzio Pisa Ricerche ed il Centro Ricerche RAI di
Torino con lo scopo di individuare dei parametri sensibili alla de-
gradazione della qualità percettiva e di sviluppare dei metodi per
una sua valutazione oggettiva.
Nel primo capitolo viene fornita un’introduzione teorica al proble-
ma della compressione video ed agli attuali metodi di valutazione
Introduzione
3
della sua qualità percettiva. Nel secondo capitolo si riporta una pa-
noramica relativa a tutti gli standard MPEG attualmente esistenti o
in fase di definizione, mentre nel terzo si scende nei dettagli della
codifica video MPEG-2. Nel quarto capitolo è descritto il materiale
usato per lo svolgimento delle prove sperimentali.
Il quinto capitolo presenta uno studio di tutti i parametri diretta-
mente disponibili nel bitstream delle sequenze utilizzate. Infine, nel
sesto capitolo, sono definiti dei parametri innovativi per la valuta-
zione della qualità di una sequenza MPEG-2 e sono presentati i ri-
sultati sperimentali relativi a tutte le sequenze a disposizione, com-
presse utilizzando sia un codificatore software che uno hardware. I
risultati ottenuti sono stati confermati da un’ispezione visiva delle
sequenze sotto esame.
4Capitolo 1
Video digitale.
1.1 Vantaggi del digitale.
Negli ultimi anni, gli algoritmi di compressione video e le loro rea-
lizzazioni pratiche, hanno avuto un rapido sviluppo. I risultati otte-
nuti dei gruppi di lavoro JPEG
1
ed MPEG
2
hanno aperto la strada a
nuove applicazioni nel campo delle comunicazioni multimediali e
dei servizi di trasmissione televisiva digitale.
1
Joint Photographic Expert Group; è il gruppo che ha standardizzato l’omonimo algoritmo di
compressione per immagini statiche.
2
Moving Picture Expert Group, è il gruppo promotore degli standard MPEG 1, 2, 4 e 7.
Uno dei principali vantaggi del video digitale rispetto a quello ana-
logico è dato dall’enorme potenzialità di elaborazione del segnale
fornita nel campo numerico. Il segnale analogico infatti, una volta
registrato non permette nessuna successiva modifica; inoltre le per-
dita di qualità dovuta all'invecchiamento ed alla duplicazione dei
nastri magnetici è elevata. Il segnale digitale, invece, oltre ad esse-
re duplicabile senza perdita di qualità, può essere facilmente modi-
Cap 1 – Compressione video
5
ficato anche in fase di post-produzione. Dopo la compressione il
segnale video digitale può essere trasmesso utilizzando una banda
inferiore rispetto a quello analogico, per questo motivo i nuovi ca-
nali televisivi via satellite stanno orientandosi esclusivamente verso
il digitale, abbandonando i vecchi sistemi analogici ormai superati.
1.2 Perché comprimere?
Il flusso di una sequenza video digitale è caratterizzato da un bit
rate estremamente elevato, tale da rendere improponibile la sua tra-
smissione su qualsiasi canale. Per verificare quanto detto suppo-
niamo di volere trasmettere una sequenza in formato SIF (720 pixel
x 576 line a 25 frame/secondo), con frame di tipo RGB (24
bit/pixel) ottengo quindi:
720 x 576 pixel 414720 pixel/frame
x 24 bit/pixel (RGB) 9.953.280 bit/frame
x 25 frame/sec 248.832.000 bit/sec
= Bit rate necessario 250 Mbps
Bit rate neccessario per il video digitale
Questo valore conferma l’impossibilità di trasmettere direttamente
il video digitale; basti pensare infatti, che per le dorsali telefoniche
nazionali sono utilizzati collegamenti a 34Mbps, di gran lunga infe-
riore alla banda necessaria per i nostri scopi.
Nella seguente tabella sono riportati, come termine di paragone, al-
cuni valori di banda per i più comuni canali e mezzi di memorizza-
zione di uso comune.
Cap 1 – Compressione video
6
Canale Bitrate supportati:
PSTN modem. >30kbit/sec
ISDN. 64-1920Kbit/sec
LAN. 10-100Mbit/sec
ATM. >135Mbit/sec
Etere. 18-20Mbit/sec
TV via cavo. 20-40Mbit/sec
CD-ROM.(× 1)
1.4Mbit/sec.
DVD. 9-10Mbit/sec
Capacità di canali e supporti
La gestione e la trasmissione di una quantità di dati così elevata ha
reso necessaria la ricerca di algoritmi per la riduzione del bit rate
complessivo ad un valore accettabile. In fase di ricezione i dati,
prima di essere utilizzati, dovranno essere elaborati da un opportuno
decoder che ricostruisca il segnale originale.
1.3 Basi teoriche della compressione.
La compressione video ha l'obiettivo di diminuire il bit rate della
sequenza elaborata, il che risulta possibile evitando la trasmissione
di tutti quei dati non indispensabili alla ricostruzione del filmato.
Chiameremo l'informazione superflua ridondanza.
La ridondanza presente in una sequenza può avere diverse origini,
ognuna delle quali è eliminata utilizzando tecniche adeguate. In
particolare i principali tipi di ridondanza sono:
! Ridondanza Spaziale.
! Ridondanza Temporale.
Cap 1 – Compressione video
7
! Ridondanza Percettiva.
La ridondanza spaziale è dovuta alla correlazione esistente tra pixel
vicini di uno stesso frame. Questo tipo di ridondanza, presente già
nelle immagini fisse, è ridotta mediante tecniche di codifica diffe-
renziale e quantizzazione dei coefficienti trasformati
3
relativi ai
blocchi dell’immagine.
La correlazione esistente tra pixel appartenenti a frame diversi, è
invece detta ridondanza temporale ed è sfruttata attraverso tecniche
di predizione del moto.
La ridondanza percettiva, a differenza delle precedenti, non è legata
alle caratteristiche del segnale ma dipende dalle capacità visive
dell’occhio umano. La sua eliminazione è realizzata attraverso tec-
niche di quantizzazione che prevedono lo scarto di tutti quei dettagli
non apprezzabili dall’osservatore. Questa operazione aumenta note-
volmente il fattore di compressione totale, introducendo però delle
perdite di informazione non recuperabili; in altre parole, il filmato
decompresso non sarà più una copia esatta dell'originale, ma sol-
tanto una sua approssimazione.
Utilizzando opportuni algoritmi di compressione è possibile dimi-
nuire sensibilmente il bit rate mantenendo una buona qualità
dell’immagine (si veda la tabella nella pagina seguente).
Cap 1 – Compressione video
8
Standard
Risoluzione video.
pels x lines x frame/s
Bitrate non
compresso (RGB)
Bitrate
compresso
Rapporto
di compr.
Film
(USA,Japan)
(480x480x24Hz) 133 Mbit/sec. 3-6Mb/s 22-44
NTSC video (480x480x29.9Hz) 168 Mbit/sec. 4-8Mb/s 22-44
PAL video (576x576x25Hz) 199 Mbit/sec. 4-9Mb/s 50-22
HDTV video (1920x1080x30Hz) 1493 Mbit/sec. 18-30Mb/s 82-50
HDTV video (1280x720x60Hz) 1327 Mbit/sec 18-30Mb/s 74-44
ISDN
v.phone(CIF)
(352x288x29.97Hz) 73 Mbit/sec. 64-1920K/s 38-1140
PSTN
v.phone(QCIF)
(176x144x29.97Hz) 18 Mbit/sec 10-30Kb/s 1800-600
Confronto del bit rate tra originale e codificato
La banda necessaria alla trasmissione del video dopo la compres-
sione è facilmente reperibile a basso costo; questo giustifica la cre-
scente tendenza verso il video digitale.
1.4 Algoritmi di codifica.
Dopo la compressione, il segnale video non potrà più essere utiliz-
zato immediatamente, ma dovrà essere riportato nella forma origi-
nale tramite il processo di decodifica. Con il termine algoritmo di
co-decodifica, generalmente si intende l’insieme di entrambi i pro-
cessi:
! Codifica
! Decodifica
Come già specificato nel paragrafo precedente, il processo di co-
decodifica introduce nel segnale delle degradazioni che possono es-
sere più o meno marcate. A causa di tali degradazioni il segnale de-
codificato non sarà più una copia esatta dell’originale ma una sua
approssimazione, per cui si parla di codifica lossy. Nel caso in cui il
3
La trasformazione utilizzata è la DCT, per maggiori dettagli si rimanda al capitolo 3.
Cap 1 – Compressione video
9
segnale decodificato rimanga identico all’originale si parla di codi-
fica lossless.
Questi ultimi, sebbene non introducano perdite, non riescono a for-
nire dei buoni rapporti di compressione, per questo motivo sono
utilizzati soltanto in alcune applicazioni professionali nelle quali è
indispensabile mantenere il segnale integro da artefatti. Per quanto
riguarda invece gli algoritmi lossy, è necessario verificare che le
perdite introdotte non siano tali da generare una eccessiva degrada-
zione della qualità video. Una seconda importante distinzione per i
diversi algoritmi di codifica è quella tra bilanciati e sbilanciati. Un
algoritmo bilanciato ha una esatta simmetria tra il processo di codi-
fica e quello di decodifica (il decodificatore è quindi composto dai
blocchi inversi del codificatore), per cui la complessità dei due pro-
cessi risulta paragonabile. Un esempio è dato dal sistema M-JPEG
4
che, non prevedendo procedure di predizione del moto, avrà una
struttura esattamente simmetrica. Per ottenere un elevato rapporto
di compressione è necessario sbilanciare l’algoritmo. In questo
4
Moving-JPEG: non è un vero e proprio standard, si basa sul sistema JPEG codificando tutti i
frame della sequenza come se fossero indipendenti. Il rapporto di compressione è basso (4:1
Processo di co-decodifica
Cap 1 – Compressione video
10
modo è possibile utilizzare strumenti di codifica molto potenti come
la predizione del moto, senza complicare l’algoritmo di decodifica.
Questo offre la possibilità di costruire decoder a basso costo per-
mettendo così una distribuzione su larga scala.
Il sistema MPEG, che analizzeremo dettagliatamente nel seguito, è
un algoritmo lossy sbilanciato; (infatti la predizione del movimento
presente nel codificatore è assente nel decodificatore) le perdite in-
trodotte sono causate della quantizzazione dei blocchi DCT
5
.
1.5 Perdita di qualità.
Nel caso della codifica MPEG, la perdita di qualità è causata prin-
cipalmente dal processo di quantizzazione che introduce delle ap-
prossimazioni non recuperabili sul segnale video.
MPEG prevede due criteri di codifica, VBR (Variable Bit Rate) e
CBR (Constant Bit Rate), il primo impone una qualità costante per
tutta la sequenza (mantenendo costante il passo di quantizzazione)
mentre il secondo mantiene costante il bit rate variando la qualità.
Utilizzando la codifica VBR, il bit rate dipenderà istantaneamente
dal contenuto della sequenza, con la codifica CBR, invece, il bit
rate sarà mantenuto costante; questo è possibile variando il passo di
quantizzazione (e quindi la qualità) in funzione delle condizioni del
buffer di uscita.
La codifica VBR, introducendo delle perdite controllate e costanti,
è preferibile rispetto alla CBR; il problema di questo tipo di codifi-
ca nasce al momento della trasmissione del bitstream compresso in
senza introdurre perdite evidenti) perché non sfrutta la correlazione temporale della sequenza.
L’unico vantaggio di questo metodo di compressione è l’estrema semplicità del codificatore.
5
Discrete Cosine Trasform, si rimanda al capitolo 3 per ulteriori informazioni.
Cap 1 – Compressione video
11
quanto la maggior parte dei canali di trasmissione (ad esempio il
transponditore satellitare) necessita, a priori, della conoscenza della
banda da assegnare al collegamento. Per questo motivo la codifica
VBR è utilizzata quasi esclusivamente per la memorizzazione di
materiale su supporti digitali (ad esempio la registrazione di film su
supporti DVD). Attualmente è in corso di sperimentazione la tra-
smissione di video VBR su reti ATM che, per le loro caratteristiche
di funzionamento, consentono di operare con bit rate variabile; ri-
mangono comunque aperte le problematiche relative alla qualità del
servizio in tutte le soluzioni che non fanno uso dell’allocazione di
picco.
In questo lavoro di tesi, saranno studiate esclusivamente sequenze
codificate CBR, per le quali la valutazione della qualità ha una im-
portanza fondamentale.
1.6 Valutazione oggettiva della qualità.
Per codificare efficacemente una sequenza video, è necessario sta-
bilire quale sia il bit rate ottimale. Infatti un bit rate troppo basso
genererebbe una eccessiva degradazione del segnale, mentre uno
troppo alto aumenterebbe inutilmente i costi di trasmissione.
Sebbene siano stati fatti molti tentativi di classificazione per valuta-
re a priori il bit rate da assegnare alla codifica in base al tipo di fil-
mato (sport, documentario, notiziario, film…), i risultati in questo
senso non sono stati molto incoraggianti. Pertanto, generalmente,
vengono effettuate più codifiche a diversi bit rate e viene scelta
quella minima che conservi una buona qualità.