I formatori dovrebbero dire ai cani quando il loro comportamento è sbagliato?

SC Psychological Enterprises photo
Fonte: foto di SC Psychological Enterprises

Il Golden Retriever si spostò sul pavimento dove erano sparpagliati una mezza dozzina di oggetti a forma di manubrio. Mentre il cane si avvicina a uno di questi l'allenatore dice "Sì!" Con voce entusiasta. Il cane afferrò immediatamente l'articolo e glielo restituì in cambio di una sorpresa.

Alcuni istanti dopo l'articolo con il profumo del gestore era stato restituito al gruppo di altri oggetti e collocato in una posizione diversa. Di nuovo il grosso cane giallo avanzò e stava per sollevare un altro oggetto dal pavimento, tuttavia questa volta non era l'oggetto con il profumo giusto. Dopo aver visto ciò, il conduttore annunciò "Scusa!" Il cane smise di prendere l'oggetto sbagliato, guardò l'allenatore, e in un modo piuttosto sommesso iniziò a esplorare gli altri oggetti. Alla fine decise l'oggetto giusto, che fece scattare un altro felice "Sì!" E quando tornò con lui ebbe un'altra sorpresa.

La prima parte di questa sequenza di allenamento è un aspetto abbastanza comune e familiare dell'addestramento del cane. È simile a quello che viene chiamato "clicker training" in cui un suono o un segnale funge da indicatore di ricompensa per indicare che il cane è fatto per correggere la risposta e questo indicatore lo informa che un trattamento sarà in attesa quando ritorna al conduttore ( clicca qui per maggiori informazioni a riguardo). La seconda parte della sequenza di allenamento è considerevolmente meno comune, poiché in questo caso la parola "Scusa" è un indicatore che indica al cane che si sbagliava e che questa volta non è prevista alcuna ricompensa.

Ho chiesto all'allenatore perché ha scelto di usare questo "no marker" e lei ha detto, "Dire al cane che è sbagliato gli fornisce semplicemente delle informazioni extra e gli consente di abbandonare qualsiasi risposta senza sbocco e passare ad altri comportamenti che sono più probabilità di essere premiati. Ho letto un paio di volte e sono stato a workshop in cui diversi noti addestratori di cani hanno affermato che dire al cane quando è sbagliato e quando sta facendo la cosa giusta è un metodo di allenamento più efficiente ".

L'idea di un marker di ricompensa durante l'addestramento degli animali è stata introdotta dallo psicologo BF Skinner. Ho avuto molte opportunità di parlare con lui perché spesso andava a Vancouver perché sua figlia era sposata con un membro del dipartimento di storia della mia università. In tali visite si recava spesso dal Dipartimento di Psicologia per visitare con amici e conoscenti. A un certo punto mi ricordo di chiedergli come gli addestratori di cani potrebbero usare i segnalini. Nello specifico volevo sapere se dovevamo dire a un animale quando stava facendo qualcosa di sbagliato e non stava per essere ricompensato nello stesso modo in cui gli dicevamo quando aveva ragione e stava per ottenere la sua ricompensa.

Lui scosse la testa e sorrise. "Ogni volta che ricompensi un animale per aver fatto la cosa giusta, rafforzi quella risposta e rendi più probabile che accada di nuovo. Ma segnalare a un animale che è sbagliato rende proprio questo segnale una sorta di punitore. E la verità è che gli animali vogliono evitare qualsiasi cosa associata a qualsiasi situazione in cui potrebbero essere puniti. Fai cruciverba? "Annuii. "Beh, il divertimento di fare cruciverba è che ogni volta che ottieni qualcosa di giusto ti senti come se fossi stato premiato. Immagina cosa succederebbe se ogni volta che mettevi giù una parola sbagliata o scrivessi una lettera sbagliata in un quadrato, il puzzle ronzasse per dirti che ti sbagliavi. Immagina che lavorare con questo cruciverba sarebbe divertente come lavorare in un posto in cui devi semplicemente curiosare finché non hai ottenuto la risposta giusta senza commenti negativi? Pensi che vorresti volontariamente scegliere di lavorare a quel puzzle che ti dava quel feedback extra negativo piuttosto che optare per il formato più tradizionale? "

Ci ho pensato e sono giunto alla conclusione che Skinner aveva probabilmente ragione. Credo che preferirei la situazione in cui tutto il mio feedback si concentrava solo sulle mie risposte corrette senza fare storie per i miei errori. Se questo è il caso per una persona, non è ragionevole presumere che gli animali che si stavano allenando probabilmente si sentirebbero allo stesso modo. Tuttavia non c'erano dati reali a supporto di quella conclusione – fino ad ora.

Recentemente ho ottenuto una copia di una tesi scritta da Naomi Rotenberg, che era una studentessa di Master presso l'Hunter College della City University di New York *. L'esperimento riportato in quella tesi ha affrontato direttamente questo problema. Lo studio di Rotenberg è stato piuttosto semplice e ha coinvolto 27 cani addestrati per eseguire un semplice trucco (posizionare entrambe le gambe in un cerchio sul pavimento). La metà dei cani è stata insegnata usando solo un marker di ricompensa, in questo caso il suono tipicamente usato di un clicker. L'altra metà del gruppo è stata insegnata sia con un suono clicker gratificante, ma in aggiunta avrebbero sentito un tono (solo il tono che chiamiamo "medio C" su un pianoforte) che ha detto al cane che aveva commesso un errore e scelto il comportamento sbagliato

La sequenza di addestramento ha coinvolto lo sperimentatore che ha emesso il comando "Hoop" e poi ha indotto il cane a fare la risposta corretta dopo di che ha sentito il clic e ha ottenuto una ricompensa. L'allenamento è stato suddiviso in sei diversi livelli in cui l'esca è stata gradualmente eliminata. Al livello più alto il cane ha semplicemente ricevuto il comando verbale e ci si aspettava che eseguisse il comportamento. Quanti livelli di successo il cane ha superato durante la sessione di allenamento era un'indicazione su quanto l'animale aveva imparato. Inoltre, la percentuale di risposte corrette è servita come un'altra misura della competenza del cane.

I risultati erano abbastanza chiari. I cani che sono stati premiati per le loro risposte corrette e che hanno semplicemente ignorato le loro risposte errate hanno fatto decisamente meglio. Questi cani impararono più velocemente e raggiunsero un livello più alto di competenza rispetto ai cani che ricevettero le "informazioni extra" che dicevano loro quando si sbagliavano. Durante le sessioni di allenamento il livello mediano di raggiungimento per i cani i cui errori sono stati ignorati era di livello 4 (su 6), mentre per quelli a cui era stato detto quando erano sbagliati e quando avevano ragione, si otteneva solo una prestazione mediana di livello 1 In termini di percentuale corretta, quei cani che hanno ricevuto solo i marcatori che indicano quei casi quando hanno fatto la cosa giusta hanno raggiunto un tasso di risposta corretto del 60%, mentre quei cani a cui è stato anche detto quando hanno fatto la cosa sbagliata sono riusciti a essere corretti solo Il 27% delle volte. Un'analisi statistica ha mostrato che nel complesso i cani a cui era stato detto solo quando erano corretti erano quasi due volte più abili alla fine dell'allenamento.

Rotenberg riassume i suoi risultati in questo modo [dove sto spiegando le sue abbreviazioni tra parentesi quadre].

Non solo [i marcatori non-ricompensa che dicevano ai cani che erano sbagliati e che nessun trattamento stava arrivando] influenzano significativamente le prestazioni dei cani in generale, ma hanno portato molti cani a fallire molto presto nella sessione di allenamento. I cani che hanno sentito un [marker di non ricompensa] a seguito di un errore precoce hanno continuato a commettere errori e nessuno è stato in grado di avanzare per attirare il livello 2. Al contrario, i cani i cui primi errori sono stati ignorati sono stati in grado di recuperare e alla fine passare all'esca. livello 2. Questo schema di risultati dà credito ad alcune affermazioni di alcuni formatori che sentire [marcatori non-ricompensa] potrebbe far abbandonare alcuni cani all'allenamento, piuttosto che tentare di superare gli errori per eseguire correttamente il comportamento …

In altre parole, i cani che stanno semplicemente lavorando per scoprire i comportamenti corretti, e sono ricompensati per quei comportamenti, mantengono il compito di allenamento e alla fine riescono, mentre quei cani che non solo vengono informati quando hanno fatto la risposta corretta ma anche quando hanno fatto la risposta sbagliata sembrano diventare scoraggiati e abbandonare l'intero compito di apprendimento.

Stanley Coren è l'autore di molti libri tra cui: The Wisdom of Dogs; Do Dogs Dream? Nato per Bark; The Modern Dog; Perché i cani hanno i nasi bagnati? The Pawprints of History; Come pensano i cani; How To Speak Dog; Perché amiamo i cani che facciamo; Cosa sanno i cani? L'intelligenza dei cani; Perché il mio cane agisce in questo modo? Capire i cani per i manichini; Ladri del sonno; La sindrome di sinistra

Copyright SC Psychological Enterprises Ltd. Non può essere ristampata o ripubblicata senza autorizzazione

* Dati da: Naomi Rotenberg (2015). Preparare un nuovo trucco usando marcatori senza ricompensa: Effetti sulle prestazioni dei cani e sui comportamenti da stress. Tesi di Master, Hunter College, New York. Opere accademiche CUNY. http://academicworks.cuny.edu/hc_sas_etds/12