Découvrir le renforcement positif (R+)

 
renforcement positif agathe tangka

Avant de rencontrer Agathe, le R+ était une notion très théorique pour moi. De ce que je lisais sur internet (majoritairement en anglais), je trouvais ça beau mais je me demandais comment cela fonctionnait concrètement. Au cours de mes deux séances photo avec Agathe et des deux jours passés avec elle et son bel appaloosa, j'ai découvert qu'un monde des possibles s'ouvrait devant moi. Une approche radicalement différente de tout ce que je connaissais déjà. Ces idées en anglais qui m'ont séduite se retrouvaient réellement là, devant moi. C’est pourquoi j’ai envie de partager cette découverte avec vous. Parce que de part mon métier de photographe, j'ai le privilège de rencontrer de nombreuses femmes (et hommes !) de cheval qui ont de précieux savoirs à partager, je souhaite partager à mon tour tous ces savoirs enseignés.

Qu’est-ce que le R+ ?

Le R+ est l’un des 4 types de conditionnement opérant existant développés par le psychologue behavioriste Burrhus Frederic Skinner. Quels sont-ils ?

  • Renforcement positif (R+): procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter à la suite de l'ajout d'un stimulus appétitif (= désirable, qui donne satisfaction) contingent à la réponse. Ex: ajout d’une friandise, d’une caresse.

  • Renforcement négatif (R-): procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter à la suite du retrait d'un stimulus aversif contingent à la réponse. Ex: retrait de la pression du licol, de la pression de la main.

  • Punition positive (P+): procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer à la suite de l'ajout d'un stimulus aversif ou conséquence aversive contingente au comportement cible. Ex: ajout d’un coup de stick, d’une claque sur le nez.

  • Punition négative (P-): Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer à la suite du retrait d'un stimulus appétitif. Ex: retrait de la nourriture.”

(Source: Wikipédia)

Le R+ fonctionne ainsi:

  • lorsque le cheval réalise le mouvement souhaité, la bonne réponse lui est indiquée grâce à un marqueur (c’est tout le principe du clicker training dont vous avez peut-être déjà entendu parlé)

  • puis le cheval reçoit une récompense par l'ajout d'une friandise ou d'une caresse suite à ce marqueur

La philosophie sous-jacente au R+: aider le cheval à réaliser des exercices par lui-même en faisant appel à sa motivation intrinsèque, tout en lui laissant le choix et la possibilité de dire “non”.

Un peu de vocabulaire R+

Le sculpting: installer un code tactile pour suggérer un mouvement SANS monter en phase. Si ce code tactile se transforme en pression qui augmente, alors il s’agit de R- et non de R+.

Le shaping: récompenser la moindre ébauche de ce mouvement par l’ajout d’un stimulus appétitif pour faire comprendre au cheval le mouvement qu’il doit exécuter. Chaque étape qui mène au mouvement final souhaité est récompensée pour arriver jusqu’à ne récompenser que le mouvement final une fois que toutes les étapes précédentes ont été acquises.

Le scanne et capture: associer directement un comportement produit naturellement par le cheval à une récompense et à un code.

Le leurre: suivre le mouvement de la friandise (l’image de l’âne qui suit la carotte au bout d’une canne à pêche)

Le respect de la friandise: Si le cheval ne vous respecte pas en présence de friandises, plusieurs choses sont à vérifier: 

  • vérifier que les besoins du cheval sont respectés. Par exemple, la jument dont je m’occupe a connu un hiver difficile une année (sous alimentation à cause d’un pré avec une herbe pauvre) et était très excitée par son seau de granulés ou la pomme que je lui apportais. Travailler en R+ à ce moment-là aurait été contre productif puisque la nourriture avait une valeur bien trop forte et n’aurait pas permis de travailler dans le calme.

  • avoir le bon timing pour donner la friandise.

  • varier les friandises pour trouver celle qui convient le mieux à mon cheval: celle dont mon cheval a envie mais pour laquelle il reste calme. A la place d’une pomme/carotte je peux utiliser un granulé de foin (en vente chez Krämer par exemple).

Mon avis personnel sur le R+ 

Personnellement je trouve que c’est une méthode qui mérite d’être incorporée dans le travail avec les chevaux. En dépassant les préjugés concernant la friandise, à savoir qu’elle énerve le cheval et que l’humain est un “distributeur de bonbons”, je pense qu’elle permet de donner envie au cheval de communiquer avec moi et de lui donner envie de faire les exercices que je lui propose. Certes il le fait pour une récompense alimentaire (ça peut être aussi des gratouilles si mon cheval adore ça !), mais ne serait-il pas égocentrique de penser que le cheval doit faire les choses uniquement pour ME faire plaisir ? La perspective de pouvoir interagir avec mon cheval tout en LUI faisant plaisir me séduit et me donne envie de m’initier au R+. Pour le moment cette réflexion est pour moi très théorique et basée uniquement sur ce que j’ai pu observer lors de mes recherches sur internet et lors de mes 2 séances photos avec Agathe.

“Motivation - Qu’allez vous utiliser, la carotte ou le bâton?” Source: https://jacobsmithdesign.wordpress.com/2014/12/08/carrot-and-stick/

“Motivation - Qu’allez vous utiliser, la carotte ou le bâton?”

Source: https://jacobsmithdesign.wordpress.com/2014/12/08/carrot-and-stick/

J’ajouterais que le R+ est une méthode d’apprentissage parmi tant d’autres. L’écoute de son cheval compte plus que la méthode utilisée. Dans le R+ comme dans le R-, il est possible d’utiliser ces techniques de manière contraignante. Ex: je peux forcer mon cheval à se plier pour un salut de la reine avec beaucoup de pression (R-) et je peux forcer mon cheval à se plier pour un salut de la reine en l’obligeant à chercher la friandise entre ses jambes (utilisation de la friandise comme leurre, R+). Dans le premier cas le cheval exécute le mouvement pour échapper à une pression; dans le second cas le cheval exécute le mouvement par appât du gain. Mais dans les deux cas le cheval peut présenter des signes d'inconfort physique (le salut de la reine est un mouvement physiquement difficile à réaliser pour le cheval) et c’est à moi de savoir les détecter. 

Un autre exemple de R+ utilisé de manière malveillante envers des animaux: les orques (et autres mammifères marins) dans les parcs aquatiques. Elles sont affamées et savent qu’elles auront accès à de la nourriture uniquement si elles exécutent correctement des tours de cirque divers et variés pour amuser le public.

Pour conclure

Avec ou sans friandise, l’essentiel est d’être à l’écoute et de respecter notre cheval. Je vous recommande la lecture de cet article étant donné que peu importe la méthode utilisée, le savoir-être avec notre cheval est primordial: “Sans friandises, comment motiver son cheval ?

Bibliographie: Wikipédia, le blog d’Agathe, le blog d’Océane, la thèse sur l’Intérêt de l’utilisation et de l’entrainement aux soins (“Medical Training”) chez les chevaux de Léa Gely pour son doctorat vétérinaire, communiqué de presse Maltraitance des cétacés: […] plaintes contre le Marineland d’Antibes, film Blackfish.

Pour aller + loin:

Lectures R+

R+ et proprioception

R+ et animaux

Cet article vous a plu et vous a appris de nouvelles choses ? Je vous invite à le partager à votre tour pour diffuser ces connaissances équestres !