cd retriever

Il Principio di Premack

Il nuovo codice deontologico Enci richiede che l’addestratore usi nell’educazione esclusivamente sistemi basati sul rinforzo positivo. Questa frase ci ha fatti saltare di gioia, fino a quando non abbiamo sentito i primi commenti. “Significa lavorare con la pallina o il boccone in mano”.
FALSO. Per due motivi.
vedi anche: ENCI e Rinforzo Positivo


Primo. Lavorare con la pallina o il cibo in mano è lavorare in stimolo, non in rinforzo.
Secondo. Cibo e pallina possono essere rinforzi, ma possono anche non esserlo. Un rinforzo positivo è qualcosa che al cane piace, e che aumenta un comportamento. Se date un bocconcino al cane, e il cane lo sputa, il cibo non è un rinforzo. Se gli date un bocconcino, e il cane non ripete quello che stava facendo, non è un rinforzo.

CHI ERA DAVID PREMACK?
Terzo. Un rinforzo è qualunque cosa piace al cane e aumenta un comportamento. E qui entra in ballo David Premack. Io l’ho sempre definito un primatologo, uno che studia le grandi scimmie, ma in realtà credo fosse uno psicologo. Negli anni Sessanta ha compiuto degli studi sul condizionamento e sul rinforzo.
Vi riporto uno degli esperimenti, così tanto per darvi un’idea. David Premack mette dei bambini di fronte a due alternative: mangiare un dolcetto o giocare a palla. Alcuni preferiscono il dolce, altri il gioco. Quindi prende metà dei bambini e mette come condizione che giocare a palla è il modo per ottenere il dolce. Premack scopre che solo nei bambini che preferiscono il dolce al gioco aumenta la frequenza di gioco. Pur di mangiare il dolce, il bambino gioca di più a palla. Nell’altro gruppo la condizione è l’opposto: i bambini che mangiano il dolce possono giocare a palla. Se un bambino vuole giocare a palla, deve mangiare il dolce prima. Solo nei bambini che preferiscono giocare a palla al mangiare il dolce aumenta il consumo di dolci. Quindi, quel bambino mangia più dolci, pur di giocare a palla.

COMPORTAMENTI COME RINFORZI
Morale della storia: un comportamento può rinforzarne un altro. In termini più scientifici, il principio di Premack suona così: “un comportamento esibito a maggiore frequenza o probabilità tende a rinforzare comportamenti che vengono esibiti a una minore frequenza/probabilità”. O ancora “per ogni coppia di risposte, quella indipendentemente più probabile rinforzerà quella meno probabile”. Se distribuite il comportamento del cane in una scala di probabilità, potete individuare quali comportamenti rinforzeranno altri comportamenti. Il principio di Premack vale anche al contrario, ovvero un comportamento meno frequente/probabile punisce un comportamento meno frequente/probabile.

DALLA TEORIA ALLA PRATICA
Cosa significa tutto questo nella vita del cane, nell’educazione e nell’addestramento? Prima di tutto significa che non dovete necessariamente usare cibo o pallina come rinforzo. Un comportamento può rinforzarne un altro. Uscire dalla porta rinforza sedersi mentre viene agganciato il guinzaglio. Sedersi educatamente alla porta è decisamente un comportamento meno probabile di uscire dalla porta :- )). Salire in auto punisce venire quando lo chiamate, se patisce l’auto. Se il vostro cane vomita ogni volta che lo portate in auto, salire in auto è meno probabile di venire quando lo chiamate. Correre libero al parco rinforza salire in auto, ovviamente!
Nell’addestramento le implicazioni sono ancora più impressionanti. La maggior parte delle persone aspetta che il cane le guardi per dare un comando. Guardare la persona è punito dal doversi sedere a comando, se sedersi a comando è un comportamento meno probabile/frequente e gratificante per il cane. Se il vostro cane adora sedersi a comando (i miei lo adorano :- )), guardarvi viene rinforzato dal segnale di sedersi e dal sedersi. Un comportamento quindi può rinforzare o punire il comportamento precedente. Pensateci, la prossima volta che avete davanti un cane (o un bambino…).

COMPORTAMENTI COME RINFORZI POSITIVI O PUNIZIONI
Riporto. Sedersi al fronte o tornare al piede con il riportello in bocca può essere difficile per il cane. Chiedergli di sedersi al fronte o tornare al piede può quindi punire il cane per essere tornato con il riportello in bocca. Soluzione: rendere la fase finale quella più probabile/frequente e gratificante (questo è back chaining, ragazzi!)
Chiamata. Correre verso di voi può essere più gratificante del restare fermo a terra. Il terra resta può quindi essere rinforzato dalla chiamata anche in assenza di altri rinforzi.
Invio in avanti. Andare a terra a distanza può essere un comportamento meno probabile/frequente e gratificante per il cane del correre in avanti. Chiedere al cane di andare a terra può quindi punire l’invio in avanti. (Qui si lavora in target e in b.c.)

Il “trucco” è fare sempre in modo che il secondo comportamento richiesto sia quello più frequente, probabile e gratificante. In una sequenza il primo comportamento lavorato sarà quindi l’ultimo della catena.
Es. in una chiamata con il fronte, il primo comportamento lavorato è il seduto al fronte. La chiamata viene così rinforzata dal sedersi al fronte.