Skip to content

Condizionamento

Condizionamento


Ivan Pavlov e il condizionamento classico

Pavlov fu il primo a studiare sperimentalmente la capacità, comune a molti esseri viventi, di cogliere i legami associativi tra eventi. In particolare si dedicò allo studio della salivazione nei cani, attraverso il condizionamento classico: all’inizio, viene presentato al cane del cibo, che prende nome di stimolo incondizionato (SI), il quale produce la salivazione, detta risposta incondizionata (RI). Il legame tra SI e RI è un riflesso preesistente e viene detto riflesso incondizionato. Successivamente, viene presentato, in abbinamento a SI, uno stimolo neutro, ad esempio una luce: dopo diverse presentazioni, la luce diventa stimolo condizionato (SC), in grado di produrre una risposta condizionata (RC) anche senza SI. Il legame tra SC e RC è detto riflesso condizionato.

Le fasi del condizionamento classico sono 4:
  1. Acquisizione: fase in cui si ha un aumento graduale di RC in seguito alla presentazione congiunta di SC con SI;
  2. Estinzione: fase in cui si ha una diminuzione graduale di RC in seguito alla presentazione del solo SC. Questo perché così come il sistema nervoso ha imparato che SC è seguito da SI, allo stesso modo può imparare che SC non è più seguito da SI. Non si tratta di una cancellazione del precedente apprendimento ma piuttosto della formazione di un nuovo tipo di apprendimento;
  3. Recupero spontaneo: fase in cui, dopo ore o giorni dall’estinzione, si ha una forma debole e limitata di RC in seguito alla presentazione di SC.
  4. Riacquisizione: fase in cui in seguito alla presentazione congiunta di SC con SI si ha un rapido riapprendi mento di RC.
Ci sono 3 tipi di condizionamento classico:
Ritardato: è il più efficace, in cui SC viene presentato prima di SI  e si mantiene per qualche istante in contemporanea ad esso;
Di traccia: è abbastanza efficace, in cui SI è presentato dopo un certo intervallo di tempo dalla fine di SC:
Simultaneo: è il meno efficace, in cui SC e SI sono presentati contemporaneamente.

Il condizionamento ritardato e di traccia costituiscono il forward conditioning, che è il metodo più comune per produrre condizionamento classico e che prevede una distanza di massimo 2 sec. tra SC e SI.

Condizionamento di secondo ordine: si ha quando SC condiziona un altro stimolo, affinchè questo sia a sua volta in grado di produrre una RC.

Condizionamento temporale: si ha quando SI appare sempre nello stesso momento, cioè dopo un preciso intervallo di tempo dalla sua precedente comparsa. In questo caso, l’organismo impara a produrre RC poco prima del momento in cui compare SI, anche se SI viene rimosso.

Generalizzazione: avviene quando ciò che si è appreso tramite il condizionamento, viene generalizzato a stimoli simili. Ad esempio si ha  generalizzazione quando un SC diverso da quello usato nel condizionamento è comunque in grado di produrre RC: la capacità di generalizzazione aumenta al diminuire della differenza tra lo stimolo originario e quello simile.

Discriminazione: si ha quando alla presentazione di due SC, di cui solo uno è associato a SI, l’organismo produce RC solo per lo stimolo associato a SI, distinguendolo quindi dall’altro.

Overshadowing: si ha quando vengono presentati contemporaneamente due stimoli, prima di SI. Successivamente, ogni stimolo è presentato da solo per valutarne il condizionamento: il risultato è che solo uno dei due produce RC. Ciò dipende dalle diverse specie animali, che hanno ognuna delle preferenze.

Blocking: si ha quando in una prima fase viene condizionato uno stimolo. Successivamente, questo SC viene presentato contemporaneamente ad un altro stimolo ed entrambi sono accoppiati con SI: alla fine però, nonostante anche il secondo stimolo sia associato a SI, non è comunque in grado di produrre RC. Questo perché l’organismo non riceve nessuna nuova info sulla comparsa di SI che non gli sia già stata fornita da SC. Mentre nel blocking, il secondo stimolo non viene condizionato a causa di un altro precedentemente condizionato, nell’overshadowing la causa è la semplice preferenza di uno stimolo rispetto ad un altro.

Modello Rescorla-Wagner:
Rescorla dimostrò con i suoi esperimenti che il condizionamento classico non consiste in un semplice trasferimento meccanico della risposta da SI  a SC, ma dimostra invece come il sistema nervoso sia attivamente alla ricerca di info sull’ambiente circostante: il soggetto impara che SC predice SI, quindi si creano delle aspettative o previsioni. La scoperta di relazioni predittive tra gli eventi serve a capire i rapporti causali tra loro e a creare un modello del mondo in base al quale anticipare questi eventi per trarne un vantaggio adattivo.

Legge dell’effetto di Thorndike: quanto maggiore è la soddisfazione o il fastidio, tanto maggiore sarà il rafforzamento o indebolimento della risposta. Gli studi sperimentali di Thorndike portarono alla scoperta dell’apprendimento per prove ed errori, che causava l’aumento della frequenza di emissione della risposta che aveva prodotto esito positivo: uno dei suoi esperimenti consisteva in:
  • porre dei gatti affamati in una gabbia, al cui esterno c’era del cibo e il cui sportello era apribile tramite una leva all’interno;
  • inizialmente i gatti compievano movimenti casuali per cercare di raggiungere il cibo, finchè si imbatterono nella leva da premere per aprire la gabbia;
  • in seguito, l’emissione della risposta corretta era sempre più frequente.
Questi studi di Thorndike gettarono le basi per il condizionamento operante, cioè mediato dalle azioni compiute dell’organismo.

Skinner e il condizionamento operante:
Skinner sviluppa ulteriormente lo studio del condizionamento operante.
Egli divise due categorie di comportamenti:
  • comportamenti rispondenti, che derivano da riflessi innati o appresi tramite condizionamento classico, basati sull’associazione tra SI e SC;
  • comportamenti operanti, che sono compiuti volontariamente dall’organismo e sono basati sull’associazione tra stimolo e risposta.
 Secondo Skinner, l’apprendimento è dato dal rinforzo di una risposta selezionata tra le altre possibili. Uno dei suoi esperimenti consisteva in:
  • porre un topo affamato in una gabbia con una leva all’interno.
  • quando il topo comincia a muoversi per la gabbia, casualmente preme la leva, la quale somministra una pallina di cibo.
  • la pallina di cibo funge da rinforzo, necessario per instaurare il condizionamento operante.
Esistono 4 modi per ottenere condizionamento operante:
  1. Rinforzo positivo: consiste nella somministrazione di uno stimolo piacevole a seguito di una risposta comportamentale, con conseguente aumento dell’emissione di quella risposta;
  2. Rinforzo negativo: consiste nell’eliminazione di uno stimolo spiacevole a seguito di una risposta comportamentale, con conseguente aumento dell’emissione di quella risposta;
  3. Punizione positiva: consiste nella somministrazione di uno stimolo spiacevole a seguito di una risposta comportamentale, con conseguente diminuzione dell’emissione di quella risposta;
  4. Punizione negativa: consiste nell’eliminazione di uno stimolo piacevole a seguito di una risposta comportamentale, con conseguente diminuzione dell’emissione di quella risposta.
Comportamento superstizioso: un altro esperimento di Skinner, chiamato “superstizione nel piccione” consisteva in:
  • porre un piccione in una gabbia, dove il dispenser di cibo era collegato ad un meccanismo a tempo, che somministrava cibo ad intervalli prestabiliti.
  • anche se non era necessaria alcuna azione da parte dell’animale per ottenere cibo, Skinner notò che il piccione ripeteva il comportamento che stava compiendo l’attimo prima dell’arrivo del cibo, associandovi erroneamente una sua azione casuale.
Programmi di rinforzo: Skinner sperimentò diversi programmi per somministrare il rinforzo, basati sulla prestazione e sul tempo.
Quelli basati sulla prestazione prevedevano:
  • Rinforzo a rapporto fisso, in cui il rinforzo viene dato dopo un tot di emissioni di una risposta. Il soggetto lavora intensamente ma può programmare periodi di riposo;
  • Rinforzo a rapporto variabile, in cui il rinforzo viene dato ogni tanto dopo l’emissione di una risposta. Il soggetto quindi non può fare previsioni, lavora continuamente e riduce i periodi di riposo.
Quelli basati sul tempo prevedevano:
  • Rinforzo a intervallo fisso, in cui il rinforzo viene dato dopo un tempo prefissato, indipendentemente dal comportamento del soggetto, che quindi basa le sue azioni sui tempi di rinforzo;
  • Rinforzo a intervallo variabile, in cui il rinforzo viene dato a intervalli di tempo irregolari, quindi il soggetto non può fare previsioni, lavora di più e apprende di più.
Secondo Skinner, il programma migliore è quello a rapporto variabile, mentre quello meno efficace è quello a intervallo fisso. In generale comunque, gli schemi variabili producono comportamenti resistenti all’estinzione, periodo in cui il soggetto continua comunque a rispondere anche senza rinforzo.

Differenze tra condizionamento classico e operante:

Condizionamento classico Condizionamento operante
Condiziona lo stimolo Condiziona la risposta
Segue la legge della contiguità Segue la legge dell’effetto
Il soggetto è passivo Il soggetto è attivo
La risposta è: riflessa, semplice, fissa e non intenzionale La risposta è: motoria, modulabile e intenzionale
La generalizzazione è possibile e automatica La generalizzazione è possibile, sia automatica che volontaria

Learned helplessness, o impotenza appresa:
Seligman e Maier  scoprirono che gli animali possono imparare velocemente una risposta di evitamento con un SC avversivo e in particolare osservarono che gli animali che non sono in grado di evitare questi stimoli avversivi, manifestano un comportamento passivo detto impotenza appresa. Il loro esperimento che dimostra questa scoperta consisteva in due fasi:
  1. Un gruppo di cani veniva sottoposto a scosse elettriche, che potevano essere fermate premendo un pulsante; un altro gruppo di cani, anch’essi sottoposti a scosse elettriche, non potevano invece fermarle, neanche se premevano il pulsante.
  2. Successivamente, entrambi i gruppi vennero posti in una gabbia, al cui interno potevano spostarsi da una zona in cui ricevevano scosse elettriche ad una senza scosse: i cani del primo gruppo si spostano, perché sanno che con le loro azioni possono modificare la loro condizione, mentre quelli del secondo gruppo non si muovono e continuano a subire passivamente la loro situazione, in quanto l’esperienza precedente ha influenzato il loro modo di comportarsi.
Vincoli biologici all’apprendimento:
Affinchè la curva di apprendimento sia più rapida, deve esserci una compatibilità tra risposte comportamentali  e rinforzi, basata sulle caratteristiche biologiche dell’organismo. Ad esempio, un esperimento su un gruppo di piccioni prevedeva due tipi di apprendimento:
  1. per ricompensa, in cui il piccione era premiato con del cibo;
  2. per risposta di fuga, in cui il piccione era premiato con l’eliminazione di una scossa elettrica.
Le possibili risposte erano: beccare una leva e sbattere le ali.

L’esperimento dimostrò che:
  • nel caso dell’apprendimento per ricompensa, il piccione imparava più velocemente se la risposta premiata con il cibo era il beccare una leva;
  • nel caso dell’apprendimento per risposta di fuga, il piccione imparava più velocemente se la risposta premiata con l’eliminazione della scossa era lo sbattere le ali.
Questo perché usare il becco è legato ad un metodo per cercare cibo, mentre sbattere le ali è legato a un metodo per sfuggire a situazioni avversive.

Tratto da PSICOBIOLOGIA di Giulia Bonaccorsi
Valuta questi appunti:

Continua a leggere:

Dettagli appunto:

Altri appunti correlati:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.