Skip to content

Visione artificiale. Da informazioni a rappresentazioni


La posizione di Marr quindi in qualche modo coniuga questi due approcci appena citati: da un lato la retina possiede una struttura tale che ha già implicite in sé le informazioni legate alle immagini: il lavoro che essa fa è quello di “trasformarle”, attraverso computazioni, in rappresentazioni; questo approccio è vicino a quello inferenziale che sostiene appunto una sorta di interpretazione-trasformazione dei dati che si acquisiscono nel processo percettivo; dall’altro lato Marr considera il mondo regolato da leggi fisiche ben definite, che gli fanno assumere una struttura ben definita per cui riconosce la ricchezza insita nei segnali che da tale mondo arrivano.
I questo tentativo di mediazione si riscopre quello che ai primordi la VA ha fatto praticamente: utilizzare una o più immagini digitali che fotografano una scena per riconoscere gli oggetti presenti in essa. Si tratta insomma di determinare  attraverso una successione di rappresentazioni, il nome di ciascuno oggetto presente nell’immagine (quindi identificarlo) e la sua collocazione e il suo orientamento nello spazio 3D.
Per far ciò il sistema dovrebbe fare un’analisi su due livelli: in un livello più basso la macchina deve discriminare nell’immagine i vari oggetti diversi per forma e colore e dividerla in regioni diverse. Sulla base di questa visione di “basso livello” la macchina deve poi accostare ad ogni regione un oggetto stabilendo a quale regione dello spazio all’interno dell’immagine appartiene un oggetto (questa è chiamata visione di alto livello).

Tratto da INTELLIGENZA ARTIFICIALE di Carlo Cilia
Valuta questi appunti:

Continua a leggere:

Dettagli appunto:

Altri appunti correlati:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.