|
RINFORZO POSITIVO: CONTINUO O VARIABILE?
|
Questo è il primo di una serie di articoli tecnici sulladdestramento del cane. E dedicato a uno dei due argomenti che, nella nostra esperienza, si sono dimostrati più importanti nelladdestramento avanzato: il tasso di rinforzo fisso e variabile
(Laltro, per i curiosi, è alzare i criteri).
|
|
Il rinforzo positivo è qualcosa che al cane piace, che il cane vuole ottenere. Usiamo il rinforzo positivo per convincere il cane a ripetere un certo comportamento. Si siede: ottiene un bocconcino. Se ne vuole un altro, si siederà di nuovo. Sedersi funziona! Sedersi però non è che la prima parte di un lungo lavoro, se state addestrando un cane allobbedienza sportiva. Ma procediamo per gradi.
Immaginate di avere una abbondante scorta di bocconcini, e un cane goloso. Volete insegnare al vostro cane a sedersi. La prima volta potete alzare la mano con un boccone, e dargli il boccone non appena si siede (è una legge di natura, se il muso va su, il posteriore va giù). Ripetete un paio di volte. Adesso provate a rimanere fermi, e aspettare che il cane proponga il comportamento.
Se si siede, dategli un bocconcino. Spostatevi o fatelo alzare per permettergli di riproporre il comportamento. Aspettate. Si siede. Dategli un bocconcino. Fatelo alzare. Aspettate. Si siede. Dategli il boccone
E così via. Cosa sta succedendo? State rinforzando il cane OGNI VOLTA che si siede.
|
 |
RINFORZO CONTINUO (o rinforzo a rapporto fisso 1:1),
significa rinforzare il comportamento OGNI VOLTA che viene esibito. Il cane ottiene un bocconcino OGNI VOLTA che si siede.
Quando usare il RINFORZO CONTINUO?
- Quando volete ottenere un nuovo comportamento
- Quando volete fissare un comportamento
- Quando volete insegnare al cane a scegliere tra due comportamenti (discriminazione)
- Quando non è necessario passare a un tasso di rinforzo variabile
|
|
Se ci pensate, insegnare un comportamento è molto simile a una scelta. Il cane che sta imparando a sedersi può provare a mettersi a terra, saltarvi addosso, abbaiare, toccarvi con la zampa
Voi gli date un bocconcino ogni volta che tra questi comportamenti sceglie di sedersi.
Il rinforzo fisso funziona anche quando volete alzare i criteri. Rinforzate OGNI VOLTA che il comportamento rientra nel criterio scelto (sedersi dritto, a comando, veloce, senza muovere le zampe anteriori
). In termini tecnici questo è un rinforzo differenziale o selettivo. Significa che voi scegliete quale comportamento rinforzare e quale no.
Andiamo un po più avanti. Volete lavorare al seduto resta. Il cane deve rimanere seduto per due minuti. Non vi basta più dare un bocconcino ogni volta che si siede. Quello che volete è un comportamento che duri nel tempo. Se lavorate con programma di rinforzo a rapporto fisso, dovete rinforzare il cane ogni volta che rimane seduto per un certo tempo. Allinizio sarà un secondo. Per due secondi. Per dieci secondi. Per mezzo minuto. E così via, fino a rinforzarlo solo se resta seduto per due minuti (o più). Funziona.
Esiste però una strada migliore.
|
|
RINFORZO A RAPPORTO VARIABILE (in breve, rinforzo variabile), significa rinforzare il cane secondo uno SCHEMA VARIABILE di rinforzo. Il cane si siede, e ottiene il rinforzo dopo 1, 3, 1, 4, 2, 1, 5, 3
secondi in cui rimane seduto.
La semplice regola per calcolare lintervallo di variazione (metri o secondi) è: N +/- _ N.
N è il valore che voi avete già raggiunto (il cane resta seduto per 6 secondi: 6 = N; lintervallo in questo caso sarà da 3 a 9).
IMPORTANTE: è inutile voler rinforzare dopo 10 secondi se il cane non ha imparato in modo consistente a rimanere seduto per un intervallo di 3, 5 o 8 secondi!!
|
|

Nell'Obedience è richiesto un seduto resta di gruppo. Per ottenere questo esercizio è meglio scegliere un rinforzo a tasso variabile.
|
Quando usare il RINFORZO A RAPPORTO VARIABILE?
- Quando volete fissare un criterio quantitativo (spazio, tempo)
- Quando il comportamento è perfetto quanto volete che sia, o quanto siete in grado di ottenerlo, a coscienza
- Quando volete ottenere una forte resistenza allestinzione se dovete usarlo in un contesto in cui non potete rinforzare (es. piste IPO e SchH).
REGOLA: mantenete il rinforzo continuo fino quando non avete ottenuto e FISSATO il comportamento che volete, a comando, con una buona velocità (latenza bassa), in diverse condizioni. Mantenete il rinforzo continuo per un numero molto alto di ripetizioni. Lunico modo per essere sicuri che ogni risposta sia corretta, che risponda quindi ai vostri criteri, è di rinforzare OGNI RISPOSTA che è corretta.
Se la risposta corretta NON è rinforzata, e passate a un rinforzo variabile, aumentate la possibilità di errore e di variazioni sgradite.
|
|
COMPORTAMENTI CHE RICHIEDONO UN RINFORZO CONTINUO
Discriminazione olfattiva (Obedience, Mondioring)
Segnalazione olfattiva (loggetto in pista IPO, SchH)
Riporto direzionale (Obedience)
Invio direzionale (Obedience, IPO, SchH, Mondioring)
Ricerca di persone (Protezione Civile)
Scelta di ostacoli (Agility)
Zone di contatto (Agility)
Impostazione di tutti gli esercizi (Abilità di Base):
- Condotta al guinzaglio senza tirare
- Attenzione
- Posizioni (Siedi, Terra, In piedi)
- Posizione al piede
- Seguire una traccia (tracking)
COMPORTAMENTI CHE RICHIEDONO UN RINFORZO A RAPPORTO VARIABILE
Seduto, in piedi e terra resta (Obedience, IPO, SchH, Mondioring)
Condotta al piede (Obedience, IPO, SchH, Mondioring)
Fiuto su pista (IPO, SchH)
Affronto e abbaio (IPO, SchH, Mondioring)
Vigilanza (IPO, SchH, Mondioring)
Sequenza di ostacoli (Agility)
*Concatenamento di comportamenti (Fluency):
- Cambio di posizione a distanza (Obedience, Mondioring)
- Salto, alt, ritorno (Mondioring)
- Riporto direzionale (Obedience)
- Invio sul cono e nel box (Obedience)
* Il rinforzo può essere anche eseguire il comportamento successivo nella sequenza
|
|
|