Capitolo1 Descrizione della scheda
1
DESCRIZIONE DELLA SCHEDA
In questo capitolo viene descritta la scheda in modo generale
mettendo in evidenza le varie parti che la compongono e
descrivendo brevemente la funzione di ogni blocco.
1.1 IL CAMPO DI APPLICAZIONE
L’acquisizione, l’elaborazione e la trasmissione di immagini ha una notevole
importanza in campo industriale ed è sempre più pressante la richiesta di sistemi in grado di
acquisire, comprimere le immagini, memorizzarle e trasmetterle in real time o di
trasmetterle su linea telefonica. Lo scopo di questo lavoro di tesi è proprio la realizzazione
di un prototipo che possa acquisire un’immagine proveniente da un frame-grabber, la possa
eventualmente elaborare tramite un DSP e che sia in grado di trasmetterla in real-time
oppure che sia in grado di comprimerla e di trasmetterla su linea telefonica o memorizzarla
in un hard disk.
Al fine di ottenere una scheda “general purpose” si è scelto di realizzare un sistema
che sia in grado di gestire non solo le immagini ma anche l’audio.
La scheda può essere usata non solo nel campo della visione industriale ma anche come
sistema di sorveglianza infatti una delle caratteristiche che deve avere un sistema di
- 2 -
Capitolo1 Descrizione della scheda
sorveglianza è che deve poter acquisire l'immagine, deve poter effettuare un controllo della
scena sotto osservazione, riscontrare possibili situazioni di allarme e, in caso di allarme
deve poter comprimere l'immagine e trasmetterla su linea telefonica tramite modem.
Prima di passare all’analisi della scheda e dei componenti che la compongono è utile
fare luce su che cosa sia il segnale video, le relative tempistiche, i differenti formati e
rapporti di campionamento.
1.2 IL SEGNALE VIDEO
Purtroppo non esiste attualmente in tutto il mondo un unico formato video infatti, per
un segnale video a colori esistono principalmente tre tipi di formati: l’NTSC usato in
U.S.A., Canada, Giappone e parte del Sud America, il PAL usato in Europa e SECAM usato
in Francia e Russia. A questi si aggiungono i formati video non standard, che differiscono
per le loro tempistiche e caratteristiche del segnale, tra cui high resolution e video digitale,
che consentono entrambi di ottenere una migliore risoluzione video.
Il formato a cui abbiamo fatto riferimento è il PAL (Phase Alternate Line), la cui
sigla deriva dalla particolarità che la fase della componente colore del segnale varia da una
linea all’altra, al fine di prevenire distorsioni del colore stesso. Il PAL prevede una
suddivisione dell’immagine in 625 linee, con un rate di ripetizione di 25 frames al secondo,
utilizzando una scansione interallacciata, per cui ogni frame, o quadro d’immagine, è diviso
in due field, pari e dispari rispettivamente. Questo permette di ridurre della metà la
frequenza di ripetizione dei quadri immagine e quindi anche la banda del sistema, il tutto a
scapito di un piccolo aumento del rumore flicker. Quest’ultimo infatti è strettamente legato
al rate di ripetizione di ciascun quadro e rappresenta la diminuzione di luminosità
dell’immagine e del contrasto dei suoi contorni. È anche vero però che in sistemi broadcast,
a differenza di quelli ad alta definizione, la risoluzione verticale non è tale da produrre una
diminuzione nella nitidezza dei contorni sufficiente da essere sensibile all’occhio umano.
L’ampiezza del segnale video è di 1V, e più precisamente è compresa tra -0.286V e
+0.714V, distinguendo all’interno di questo intervallo la porzione di segnale al di sopra di
+0.054V, limite che indica il livello di nero, contenente la parte attiva del segnale video, e la
porzione al di sotto di +0.054V, dove è inclusa tutta l’informazione dei sincronismi
(blanking, orizzontale e verticale). L’ultimo livello di riferimento è rappresentato dal valore
di saturazione del segnale, indicato come livello di riferimento del bianco, che corrisponde a
- 3 -
Capitolo1 Descrizione della scheda
una tensione di 0.714V (vedi figura 1.1).
Fig. 1.1 Il segnale video
Di fatto quindi circa l’81% della durata di ciascuna linea è dedicata al segnale di luminanza,
le cui variazioni sono legate alle variazioni stesse di luminosità dell’immagine. La restante
parte comprende gli intervalli di blanking orizzontale, tra due linee consecutive, e quelli
verticali, tra due fields successivi. Questi intervalli, sebbene non contengano alcuna
informazione relativa all’immagine, sono tuttavia indispensabili per un corretto sincronismo
nella procedura di scansione e acquisizione del quadro visivo [1].
- 4 -
Capitolo1 Descrizione della scheda
Nella tabella 1.1 sono riportati i dati principali e le tempistiche del formato video analizzato:
Formato video PAL CCIR-601
N° linee/frame 625 linee
N° linee/field 312.5 linee
N° linee/frame effettivo 576 linee
N° linee/field effettivo 287.5 linee
Durata di una linea 64 µs
Durata di una linea attiva
(video active)
52 µs
Frequenza di riga 15.625 KHz
Intervallo di blanking orizzontale 12 µs
front porch 1.48 µs
Bach porch 5.6 µs
Inpulso Hsync 4.92 µs
Impulso di equalizzazione 2.35 µs
Burst 2.44 µs
Breezeway 1.11 µs
Frequenza di quadro 25 Hz
Frequenza sottoportante
di colore
4.4336 MHz
Banda nominale 5MHz
Frequenza di campionamento 17.7MHz
N° pixels/linea 864
N° pixels/linea effettivo 720
Tabella 1.1 Il formato standard PAL CCIR-601
- 5 -
Capitolo1 Descrizione della scheda
Poichè si intende usare segnali video a colori è necessario definire i concetti di luminanza e
crominanza perchè verranno usati nei successivi capitoli. La riproduzione dei colori si basa
sul principio della tricromia, secondo cui tutti i colori, ai fini della percezione soggettiva,
sono generati da una combinazione dei tre colori primari: rosso, blu e verde. Generalmente
la ripresa del segnale video a colori è effettuata con tre tubi separati preceduti
da uno schermo rispettivamente rosso, verde e blu. La trasmissione delle tre immagini
potrebbe avvenire singolarmente, per essere poi riprodotte separatamente nei tre colori ed
infine combinate a creare l’immagine.
Una tecnica simile si rivelerebbe sconveniente per il fatto che richiederebbe una banda tripla
rispetto a quella richiesta dalla trasmissione del segnale monocromatico. Da qui è nata
l’esigenza di sviluppare dei sistemi che mantenessero inalterata la qualità del segnale, ma
con un risparmio in termini di banda richiesta. Il sistema PAL infatti prevede la trasmissione
non dei tre segnali relativi ai tre colori primari, bensì di tre combinazioni lineari degli stessi,
di cui una genera il segnale di luminanza Y (immagine in bianco e nero), e le altre due sono
date dai segnali rosso e blu da cui è sottratto il segnale stesso di luminanza, R-Y e B-Y.
- 6 -
Capitolo1 Descrizione della scheda
1.3 DESCRIZIONE DEL PROTOTIPO REALIZZATO
Il prototipo realizzato può essere idealmente suddiviso in tre parti:
• Modulo acquisizione del segnale video: questa parte comprende il sensore CMOS per
l’acquisizione dell’immagine, l’encoder Bt866, i connettori BNC, la logica combinatoria
per gestire correttamente il timing di acquisizione e il microcontrollore TS80C51Rx2
che supervisiona il processo di acquisizione e gestisce il collegamento fra questa parte
della scheda e le altre;
• Modulo elaborazione del segnale: questa parte comprende essenzialmente il DSP e la
memoria SDRAM. Il DSP preleva dalla SDRAM esterna l’immagine da elaborare e,
dopo averla elaborata, la riscrive nella SDRAM o la manda all’encoder Bt866 per
visualizzarla sul monitor oppure la manda al modulo di trasmissione;
• Trasmissione dell’immagine: questa parte comprende i dispositivi che permettono
l’interfacciamento della scheda con un monitor remoto, con un computer o più in
generale con un’apparecchiatura industriale. Dovendo creare una scheda “general
purpose” si è deciso di progettare questa parte della scheda in modo da prevedere due
tipi di moduli di trasmissione:
1. Trasmissione dell’immagine non compressa usando il bus seriale veloce IEEE1394;
2. Trasmissione dell’immagine compressa usando un microcontrollore che comanda un
integrato che chiameremo “gestore del nodo USB” che ha il compito di trasformare i
dati in un formato compatibile alla trasmissione sull’Universal Serial Bus;
Naturalmente sulla scheda sarà presente solo una delle due possibili interfacce per la
trasmissione, la scelta di quale interfaccia usare per la trasmissione dipende dalle esigenze
del cliente.
In figura 1.2 è possibile vedere lo schema a blocchi dell’intera scheda. Con le linee
tratteggiate sono state evidenziate le tre parti sopra descritte.
- 7 -
Capitolo1 Descrizione della scheda
Fig. 1.2 Lo schema a blocchi dell’intera scheda
1.4 SPECIFICHE DI PROGETTO
Il prototipo realizzato deve avere le seguenti caratteristiche:
• Deve essere una scheda “general purpose”, quindi deve contenere dispositivi
programmabili che permettano l’utilizzo della stessa scheda in varie applicazioni;
• Deve possedere un connettore BNC per l'uscita del segnale video analogico nei tre
possibili formati standard (PAL,NTCS,SECAM), trasmesso su cavo coassiale 75Ω e
- 8 -
Capitolo1 Descrizione della scheda
attenuazione di 2dB/100m;
• Formato della scheda: EuroCard (10cmx16cm);
• Acquisizione di un singolo quadro dell'immagine nel formato standard PAL 720x576,
per successiva elaborazione attraverso il processore DSP;
• Deve essere una scheda “low cost”;
• Tensione di alimentazione: +24 Volt per essere compatiblile con gli standard di
alimentazione presenti nelle industrie;
• Interfaccia fra la scheda e dispositivi generici per il controllo come PC, consolle PAD,
CNC ecc... con protocollo di comunicazione seriale, full-duplex standard, attraverso cui
gestire l’interfaccia con i due tipi di bus utilizzati: RS 232 e RS 485;
• la scheda può funzionare anche in modo “stand alone” cioè senza bisogno di un
computer. La scheda senza il modulo di trasmissione delle immagini può comunque
interfacciarsi a moltissimi dispositivi grazie ai bus RS 232 e RS 485.
E’stata presa in considerazione anche la possibilità di non acquisire l’immagine tramite un
sensore CMOS ma di acquisire l’immagine attraverso una più comune telecamera
analogica. L’acquisizione del segnale video tramite telecamera analogica richiede la
presenza del decoder Bt829 che digitazizza l’immagine proveniente dalla telecamera.
L’acquisizione “remota” del segnale video con l’uso della telecamera analogica non altera
le altre parti della scheda (vedi figura 1.3).
- 9 -
Capitolo1 Descrizione della scheda
Fig. 1.3 Acquisizione del segnale video con telecamera analogica
- 10 -
Capitolo 2 Modulo di acquisizione video
2
MODULO DI
ACQUISIZIONE VIDEO
In questo capitolo viene presentato il modulo di acquisizione
video che ha il compito di interfacciare il segnale proveniente dal
sensore CMOS o da una telecamera con il DSP.
2.1 IL SENSORE HDP2000
Il modulo di acquisizione video è stato studiato per acquisire l’immagine da un
sensore CMOS, analizziamo le caratteristiche di questo sensore.
Il sensore HDCS-2000, realizzato dalla Hewlet Packard, offre la possibilità di
convertire delle immagini fornendole all’uscita già digitalizzate, questo rende il sensore
interessante per la sua semplicità d’uso e per la comodità dovuta al fatto che la conversione
da analogico a digitale viene effettuata all’interno del chip riducendo così al minimo il
numero di integrati necessari. Ciascun pixel viene convertito in 10 bit disponibili su
un’interfaccia parallela sincrona. La tecnologia con la quale è realizzato il sensore è la
CMOS. L’array di pixel è 640x480 (VGA). È disponibile sia una versione monocromatica
sia a colori.
- 11 -
Capitolo 2 Modulo di acquisizione video
Fig 2.1 Il sensore HDP2000
Le caratteristiche di questo sensore sono:
• Eccellente qualità dell’immagine
• Conversione di 15 frames al secondo
• Bassi consumi
• Tollerabilità alle alte temperature
• L’integrato è saldabile dalle comuni macchine (nessuna particolare attenzione è
necessaria)
• Singola tensione di alimentazione
• Accesso casuale ai pixel
• Possibilità di creare delle finestre all’interno dell’immagine
• Possibilità di effettuare zoom dell’immagine
• Possibilità di sottocampionare di un fattore 4 l’immagine che rende possibile
raggiungere i 58 frames al secondo
• Possibilità di “congelare” l’immagine
• È disponibile un flash trigger e la possibilità di lavorare con un’otturatore meccanico
• Semplicità nel determinare un corretto tempo di esposizione
• Possibilità di funzionare in modalità di basso consumo o di standby
• Disponibilità di due ADC ad approssimazioni successive interni con risoluzione di 10
bit
• Controllo del Timing interno
• Possibilità di programmare la dimensione delle finestre, il tempo d’integrazione, il data
- 12 -
Capitolo 2 Modulo di acquisizione video
rate, il timing, il controllo degli interrupt, il modo di funzionamento
• Possibilità di amplificare in modo indipendente il rosso, il verde e il blu
• Selezione dell’uscita a 8 o 10 bit
• Accesso ai registri di stato tramite synchronous serial interface oppure tramite UART
2.2 APPLICAZIONI TIPICHE
• Telecamera per videoconferenze
• Telecamera digitale per immagini fisse
• Video sorveglianza
• Applicazioni nel campo automobilistico
• Sistema di visione per macchinari e robot
• Applicazioni biomediche
• Riconoscitore di impronte digitali
2.3 CARATTERISTICHE ELETTRICHE
• Dimensioni del pixel: 9x9 µm
• Frequenza di clock massima: 25MHz (fornita da una sorgente di clock esterna)
• A/D Dynamic Range: 60 Db
• Pixel Signal-to-Noise Ratio (SNR): 66 dB
• Corrente di buio: 0.1nA @ 22 °C
• Sensitività: 1.1 V/(Lux-sec @ 550 nm)
• Saturazione: 1.3V
• Guadagno di conversione: 16 µV/elettrone
• Programmable Gain Range: 1 – 40 (255 incrementi)
• Controllo dell’esposizione: 0.5µs – 4 s con un passo di 0.5 µs
• Package: 44 pin gull wing optical PQFP
• Alimentazione: 3.3V, -5/+10%
• Potenza dissipata: massimo 200mW in condizioni di funzionamento standard e massimo
3.3mW in standby
• Temperatura di funzionamento: da –5 a 65 °C
- 13 -
Capitolo 2 Modulo di acquisizione video
2.4 SCHEMA A BLOCCHI
Dallo schema a blocchi di figura 2.2 si può notare l’APS array che è il vero e proprio
elemento di acquisizione dell’immagine. Il segnale uscente dall’APS array viene prima
amplificato e poi passa in un amplificatore a guadagno programmabile infine viene
convertito in un segnale digitale dall’ADC. Dallo schema a blocchi si può anche notare la
presenza di un’UART (Universal Asinconous Receiver Trasmitter) e una synchronous serial
interface che sono i due modi con i quali un microcontrollore o un DSP può scrivere i
registri interni al sensore.
Fig 2.2 Schema a blocchi del sensore HDP2000
- 14 -
Capitolo 2 Modulo di acquisizione video
2.5 MODALITA’ DI FUNZIONAMENTO
Il sensore HDCS è controllato da un’interfaccia seriale che può configurare il
sensore come un half-duplex UART slave oppure come Synchronous Serial slave.
Quest’interfaccia seriale serve a scrivere nei registri di sistema del sensore, a stabilire le
coordinate della finestra visualizzata, stabilire il tempo d’esposizione, il frame rate, il
guadagno degli amplificatori PGA, la gestione di interrupt, la funzione dei pin di status e il
formato dell’output.
All’inizio delle operazioni è necessario un reset fornito tramite il pin nRST.
Quando il pin IMODE è a 1 e il pin TCLK è a 0 l’interfaccia seriale è la half duplex UART
inizializzata dal system reset alla velocità di 9600 baud che può essere incrementata agendo
sui registri BRATE e BFRAC.
Quando il pin IMODE è a 0 l’interfaccia seriale è la synchronous serial slave e il 7 bit di
indirizzo del sensore sono 1010101.
Il registro CONFIG stabilirà uno dei seguenti modi di funzionamento:
1) Normale: è il modo di default ed è usato per catturare immagini di alta qualità, il tempo
d’esposizione è controllato internamente.
2) Accumulation: è il modo che permette di determinare facilmente il tempo di esposizione
del singolo pixel.
3) Otturatore meccanico: usato per catturare immagini in corrispondenza di un segnale di
trigger esterno come ad esempio un flash.
Inoltre stabilirà se si dovrà acquisire le immagini in modo continuo (il bit CFC del registro
CONFIG è 1) o se si desidera acquisire una singola immagine (il bit CFC del registro
CONFIG è 0).
Il bit RUN del registro CONTROL viene settato tutte le volte che si inizia un’operazione.
Ogni pixel viene trasmesso attraverso un PGA (amplificatore a guadagno programmabile)
permettendo di amplificare in modo diverso il rosso, il verde e il blu. L’architettura del
sensore è suddivisa in due canali ciascuno dotato del proprio PGA la cui uscita va al
convertitore A/D che converte il segnale analogico in 10 bit.
- 15 -