3
Capitolo I
Stato dell’ Ar t e
Introduzione alle Reti Neurali
I.1. Reti neurali biologiche
Le reti neurali biologiche risultano essere alla base dello studio di quelle artificiali,
le quali sono state create per riprodurre artificialmente ciò che riesce a fare il
cervello umano come ad esempio la classificazione di un’immagine.
Per tale motivo è necessario chiarire la composizione del sistema nervoso umano.
Quest’ultimo è formato da miliardi di neuroni, i quali scambiano tra loro segnali
elettrici attraverso delle ramificazioni chiamate dendriti.
Inoltre, il neurone è formato da un corpo cellulare, il quale contiene tutti gli
elementi più importanti della cellula come il nucleo, e l’assone necessario a
trasmettere i vari impulsi ad altri neuroni attraverso dei terminali ramificati.
Infine, è importante sottolineare che tra i terminali dell’assone di un neurone e i
dendriti del neurone successivo vi è uno spazio detto spazio sinaptico.
Figura I.1: Struttura di un neurone biologico
4
Un neurone viene attivato, cioè trasmette un segnale elettrico al neurone successivo,
per via di una differenza di potenziale.
Tale differenza è causata dalla presenza in diverse quantità di ioni sodio e potassio.
La trasmissione deve attraversare diversi passaggi, infatti si verifica una fase di
attività e una di riposo.
Nella fase di riposo (1) il potenziale è negativo, quindi si ha un maggior numero di
cariche negative all’interno della cellula, esso è causato dalla minor quantità di ioni
sodio all’interno rispetto all’ambiente esterno, il potenziale in tale stato si aggira
intorno ai -70 millivolt.
Nella fase di attività, il segnale nervoso avviene tutto insieme, varia velocemente il
potenziale elettrico (2 e 3), ovvero aumenta e diventa positivo, e la trasmissione
avviene solo quando tale potenziale arriva a circa 50 millivolt, in quel punto si ha
lo spark, ovvero il raggiungimento della differenza di potenziale necessaria ad
avviare l’impulso nervoso.
Immediatamente dopo la cellula torna al potenziale di riposo col movimento inverso
delle cariche elettriche (4); tuttavia prima di tornare alla situazione iniziale il
potenziale va al di sotto di quello di riposo (5), tale momento viene denominato fase
di latenza, in essa la cellula non è capace di rispondere ad un altro segnale, e infine
la cellula torna alla fase di riposo.
Figura I.2: Variazione di potenziale all’interno della cellula
A livello della membrana plasmatica del neurone vi sono dei recettori passivi, i
quali possono essere spontaneamente aperti o chiusi in funzione della carica
elettrica circostante, e altri attivi, i quali attraverso il consumo di energia riescono
a portare gli ioni all’interno o all’esterno della cellula.
Un esempio di quest’ultimi è la pompa sodio potassio, fondamentale per il sistema
nervoso, essa tramite consumo di ATP fa passare gli ioni contro gradiente di
concentrazione (gli altri processi coinvolti nel sistema nervoso avvengono
spontaneamente per gradiente di concentrazione).
5
Nel particolare i canali sodio normalmente nella fase di riposo si trovano chiusi,
quindi il sodio esterno è impossibilitato ad entrare all’interno e la pompa sodio
potassio spinge il sodio all’esterno, quindi nella fase di riposo vi sono molte cariche
all’esterno (dato anche dal passaggio del potassio verso l’esterno).
I canali potassio invece nella fase in cui i sodio sono chiusi, risultano essere aperti,
quindi l’uscita del potassio avviene in modo naturale, e questo contribuisce a
raggiungere il potenziale di -70 millivolt.
Quando arriva lo stimolo nervoso, la pompa sodio potassio che spinge il sodio
all’esterno si arresta e non spinge più gli ioni, inoltre con l’innalzamento del
potenziale di membrana si aprono i canali sodio, così si verifica un brusco passaggio
all’interno dello ione sodio che fa variare il potenziale, riduce la negatività, e tale
processo si chiama depolarizzazione della membrana, tale spostamento di carica
prosegue fino al potenziale d’azione e dopo lo spark avviene la ripolarizzazione,
quindi si riavvia il trasferimento degli ioni, con la chiusura dei canali sodio e
apertura dei potassio, con attivazione della pompa.
Tale meccanismo avviene solo per sezioni dell’assone, non tutto insieme, pur
essendo molto rapido.
Quando l’impulso elettrico giunge ai terminali dell’assone provoca la liberazione
dei neurotrasmettitori, sostanze chimiche rilasciate dai terminali stessi, che
permette la trasmissione del segnale attraverso lo spazio sinaptico da un neurone
all’altro.
Figura I.3: Trasmissione impulso tra neuroni
6
Il cervello presenta numerose caratteristiche che lo rendono unico e di difficile
imitazione.
Esso è infatti in grado di modificare le connessioni tra i neuroni in base
all’esperienza acquisita, cioè è in grado di imparare, tale capacità viene chiamata
neuroplasticità.
La modifica delle sinapsi si verifica in seguito ad attività neurali ripetute, avviene
quindi un potenziamento delle sinapsi coinvolte in quelle determinate funzioni,
creando connessioni più forti ed efficienti.
Il cervello umano ha inoltre una grande capacità, ossia quella di continuare a
funzionare nonostante delle cellule risultano essere danneggiate, all’aumentare del
numero di queste cellule danneggiate le prestazioni degraderanno gradualmente.
Tale caratteristica viene chiamata fault tolerant.
Infine, le varie zone del cervello possono essere considerate come una cosa sola in
quanto tali zone cooperano insieme al fine di realizzare un determinato compito.
I.2. Confronto reti neurali biologiche e artificiali
Nonostante le reti neurali artificiali siano state create per riprodurre le attività
tipiche del cervello umano, i cervelli e i computer risultano avere proprietà piuttosto
differenti.
Per prima cosa è importante sottolineare che i chip dei computer risultano essere
molto più veloci rispetto ad un neurone biologico.
Quest’ultimo, infatti, solo per attivarsi richiede un lasso di tempo della grandezza
dei millisecondi; invece, un processore è in grado di risolvere determinate istruzioni
in nanosecondi, quindi sei ordini di grandezza inferiori rispetto ai millisecondi.
Tale svantaggio viene però colmato dal fatto che i neuroni riescono a lavorare
simultaneamente, a differenza di un computer che per attivare una sua unità richiede
molti cicli.
Per quanto detto, innovative ricerche tentano costantemente di realizzare una
macchina che riesca a combinare il parallelismo del cervello con la velocità di
operazione di un computer.
Per via di tale parallelismo infatti, un determinato compito come riconoscere un
volto per noi umani risulta essere molto semplice in quanto ci richiede una frazione
di secondo per essere compiuto.
La stessa istruzione però per essere svolta da un computer richiede molti cicli e per
questo non risulta essere semplice come lo può essere per il cervello umano.
Inoltre, i malfunzionamenti vengono gestiti di gran lunga meglio dal cervello
umano rispetto ad un computer.
7
Quest’ultimi infatti possono fallire un intero calcolo per via di un singolo bit
alterato.
Un’altra differenza significativa è la gestione dei nuovi input da parte del cervello
umano rispetto ad una macchina artificiale.
Il cervello infatti quasi tutti i giorni viene posto nella condizione di gestire nuovi
ingressi a differenza di un computer, il quale può riscontrare problemi con ingressi
inattesi.
I.3. Reti neurali artificiali
I.3.1. Neurone artificiale
Le reti neurali artificiali risultano essere formate da un determinato numero di
neuroni artificiali, i quali sono creati per imitare il funzionamento di quelli
biologici.
L’impulso mandato da un neurone artificiale è di tipo numerico e nella figura
sottostante viene denominato ‘y’.
Figura I.4: Modello di un neurone artificiale
Il neurone artificiale è caratterizzato da tre elementi fondamentali:
1. Le sinapsi, le quali sono delle connessioni aventi un determinato peso, in
particolare sono presenti n canali di ingresso x1, …, xn, a ciascuno dei quali è
associato un numero reale che rappresenta il peso w1, …, wn,.
2. Una sommatoria pesata necessaria ad addizionare i segnali in ingresso al
neurone.
3. Una funzione di trasferimento o attivazione la quale gestisce il segnale in uscita
dal neurone. Tale segnale viene chiamato ‘y’ ed è generalmente un numero
compreso nell’intervallo [0,1] oppure [-1,1].
8
Perciò, per quanto detto in precedenza, l’uscita viene regolata tramite la funzione
sopracitata, la quale prende in input la somma pesata dei segnali in ingresso.
Tale somma viene calcolata come segue = ∑ w
i
x
i
=1
; se il peso wi è positivo, il
canale è detto eccitatorio, altrimenti, il canale viene chiamato inibitorio.
Il valore assoluto del peso rappresenta la forza della connessione.
Esistono varie funzioni di trasferimento:
• Funzione soglia
L’uscita dal neurone (rappresentata dal valore y=f(a)) con tale tipologia di
funzione è la seguente:
rappresenta la soglia
Figura I.5: Grafico della funzione soglia
Di conseguenza è possibile notare come il neurone trasmetterà un segnale in uscita
di valore pari ad 1 solamente se la somma pesata in input sarà almeno pari ad una
determinata soglia.
• Funzione lineare
Questo tipo di funzione fornisce un segnale in uscita pari alla somma pesata ottenuta
in ingresso. (y=f(a)=a)
Figura I.6: Grafico della funzione lineare
9
• Funzione lineare a tratti
Di seguito viene riportato un esempio di funzione lineare a tratti:
Figura I.7: Grafico della funzione lineare a tratti
• Funzione sigmoide
Questo tipo di funzione e la funzione soglia risultano essere le più utilizzate in
una rete neurale.
Un esempio di tale funzione è la funzione logistica, definita come segue:
Figura I.8: Grafico della funzione sigmoide
È possibile osservare come, a differenza della funzione soglia in cui y può assumere
solamente due valori 0 o 1, in questo caso il segnale assume tutti i valori compresi
tra 0 e 1.
Inoltre, tale funzione risulta essere derivabile a differenza della funzione soglia.