4.0 CONSÉQUENCES DE LA PRÉSENTATION DE RENFORÇATEURS POSITIFS

4.1 AUGMENTATION DU COMPORTEMENT

C'est là le but de tout apprentissage, c'est-à-dire augmenter la fréquence d'un comportement de sorte qu'à la fin ce comportement s'intègre ou fasse partie du répertoire de conduite du sujet. Les béhavioristes donnent donc leur préférence aux renforçateurs positifs autant que faire se peut; car les expériences bien vérifiées en laboratoire ont démontré l'efficacité indubitable du renforcement positif. Ce constat vient confirmer ce que très tôt Saint-Augustin affirmait: «On attrape plus de mouches avec une cuillerée de miel qu'avec un tonneau de vinaigre».

4.2 DIMINUTION DE COMPORTEMENT PAR SATIÉTÉ.

Les renforçateurs positifs demeurent efficaces en autant qu'ils sont judicieusement dispensés. En effet, comme on l'a déjà souligné, un renforçateur n'est efficace que lorsqu'il a une signification pour le sujet. C'est pourquoi, par exemple, l'on fait jeûner les animaux qui doivent faire un apprentissage quelconque dans une boîte de Skinner; ainsi la nourriture devient pour l'animal affamé un renforçateur puissant et efficace. Mais si, par exemple, on soumet cet animal à un programme de renforcement continu, c.- à - d. si on récompense chacun de ses comportements désirables, il y a bien des chances qu'il soit vite repu et qu'il devienne indifférent à la nourriture qui sert de renforcement; cessant ainsi de poser le geste désiré. L'apprentissage peut s'arrêter avant d'être consolidé et risque alors de disparaître plus vite.

Ce phénomène de baisse ou de disparition du rendement est dû à la satiété . La satiété est la conséquence de l'excès de renforcement.

5.0 CONSÉQUENCES DE LA PRÉSENTATION DE RENFORÇATEURS AVERSIFS.

5.1 LA PUNITION

C'est la présence d'un stimulus aversif contingente à une réponse donnée. Le résultat de la présence de ce stimulus aversif est la diminution puis la disparition de la réponse dont elle est la conséquence.

NB: L'enlèvement du renforçateur positif. Cette situation continue aboutit à l'extinction qu'il ne faut pas confondre avec la punition.

La punition a pour but de supprimer un comportement non désiré.

5.1.1 Conditions de son efficacité

La sévérité , la fréquence de la punition et le degré de motivation qui pousse le sujet à poser le geste puni sont les trois conditions influençant l'efficacité de la punition.

Si la motivation à la base de la réponse punie demeure chez le sujet et qu'il n'y a pas une réponse de rechange, alors la réponse punie retrouve sa force initiale aussitôt que la punition est enlevée.

Ex: un enfant qui est puni parce qu'il court dans sa chambre ou au salon, recommencera à courir dans ces mêmes lieux s'il n'est pas possible de l'envoyer dans une salle de jeu par exemple ou de lui trouver un jeu plus paisible.

La punition est plus efficace pour supprimer un comportement si une réponse alternative à la réponse punie existe que si la réponse punie est la seule disponible.

Ex: l'emprisonnement sera efficace chez un chômeur qui a volé, s'il existe une possibilité de travail à la sortie de prison pour ce voleur.

Utiliser la punition avec d'autres procédures comme l'échappement ou l'évitement, donne de très bons résultats. (cf. Reese, The analysis of human operant behavior, p. 38).

6.0 CONSÉQUENCE DU RETRAIT D'UN RENFORÇATEUR POSITIF.

Le retrait d'un renforçateur positif aboutit à l'extinction du comportement qu'il a contribué à établir et à maintenir.

6.1 L'EXTINCTION

Dans le conditionnement pavlovien

À force de présenter le stimulus conditionné sans l'accompagner du stimulus inconditionné, la réponse diminue puis disparaît.

Dans le conditionnement opérant

Lorsque la réponse n'est pas accompagnée par un renforçateur positif ou négatif, cette réponse se raréfie puis disparaît.

6.2 LE RATTRAPAGE OU RÉCUPÉRATION SPONTANÉE.

Lorsque l'extinction s'est produite, la relation SC _ RC peut réapparaître après un certain temps sans apprentissage supplémentaire. Cette réapparition d'une relation SC..--> RC sans apprentissage supplémentaire s'appelle rattrapage ou récupération spontanée.

6.3 LE RETRAIT: LE «TIME OUT», L'ISOLEMENT, ETC.

Le «time out» est la période de temps pendant laquelle un sujet n'a plus l'occasion de poser un geste donné. On peut parfois réduire ou supprimer un comportement en soustrayant le sujet à la situation dans laquelle le comportement arrivait. Exemples de cas d'isolement: l'emprisonnement, l'hospitalisation, le renvoi dans la chambre à coucher, le renvoi dans la "salle de repos". L'isolement est plus effectif lorsqu'il est combiné avec d'autres procédures plus positives. Renforcer par exemple un comportement contraire (désirable) à celui qui provoque l'isolement.

Une condition essentielle pour que l'isolement réussisse c'est qu'il ne constitue pas un renforcement pour le sujet.

Exemples: Envoyer dans sa chambre un enfant qui n'aime pas manger sa portion à table devient une solution plaisante pour lui, donc un renforcement qui ne règle pas son problème de table.

Faire changer de secteur à une secrétaire retardataire ou paresseuse qui n'aime pas son patron est une solution plaisante pour elle, donc un renforcement qui ne remédiera pas à son défaut.

Renvoyer de la classe un élève qui bavarde et l'isoler dans la salle de jeu devient une situation plaisante qui renforce son comportement de bavardage. L'avantage de la technique de diminution d'un comportement par retrait est qu'elle ne nécessite pas la présentation d'un renforçateur aversif.

7.0 CONSÉQUENCES DU RETRAIT DE RENFORÇATEURS AVERSIFS OU NÉGATIFS.

7.1 L'ÉCHAPPEMENT

La suppression d'un stimulus aversif (actuel) contingent à une réponse s'appelle renforcement négatif.

Le comportement qui supprime ce stimulus aversif s'appelle échappement (escape).

Exemple: Un rat de laboratoire ou un singe apprend à presser sur un levier, si le fait de presser sur le levier supprime un choc électrique pendant un certain laps de temps (10 s par exemple), le comportement qui consiste à peser sur le levier s'appelle échappement. (Reese, p. 20)

La réponse du sujet met fin au stimulus aversif.

Exemple: Mentir pour échapper aux conséquences d'un retard ou d'une absence.

7.2 L'ÉVITEMENT:

Lorsque la réponse du sujet fait différer (remet à plus tard) l'assaut du stimulus aversif, nous avons affaire à un comportement d'évitement.

Ex: Dans les procédés usuels de laboratoire, un stimulus pré-aversif avertit le sujet; un son ou une lumière précède l'assaut du stimulus aversif, un choc électrique par exemple. Si le sujet émet la réponse désirée pendant la durée du stimulus pré-aversif, cette réponse remet (retarde) le stimulus aversif pendant un certain laps de temps (10 secondes par exemple).

N.B: Le pré-stimulus aversif, d'ordinaire neutre, peut devenir conditionné aversivement. (cf Reese, p. 36 et 38 en bas)

Tricher pour éviter l'échec.

Nous payons nos taxes et obéissons au code de la route afin d'éviter les conséquences négatives plutôt que pour en produire des positives.

Faire du bourrage de crâne, du "bachotage" en vue d'un examen, est un comportement d'évitement. (éviter l'échec)

Tous ces exemples sont des comportements d'évitement.

Dans le domaine scolaire, Bali montra que les enfants d'âge préscolaire ont appris une conduite d'évitement pour empêcher qu'une situation renforçante ne cesse. Ces enfants regardaient des dessins animés qui étaient fréquemment interrompus. En pressant sur un levier, les dessins recommençaient. Ils mettaient ainsi fin (échappement) à une situation déplaisante (l'interruption du film); une pression continue sur le levier empêchait (évitement) les interruptions. En bref, une conduite d'évitement consiste à faire en sorte qu'une situation désagréable ne se produise pas.

8.0 LES PROGRAMMES DE RENFORCEMENT:

(D'après James L. Kuethe, The Teaching-Learning process, p. 57-67. cf. aussi M. Richelle, Le conditionnement opérant, D. et N., p. 195.)

Il faut distinguer les divisions suivantes dans les programmes de renforcement.

8.1 LE RENFORCEMENT CONTINU:

On renforce chaque réponse

Exemple: - sanctionner chaque réponse données par l'élève.
- donner du grain au pigeon chaque fois qu'il picote un cercle rouge.

Conséquence

Ce programme est efficace et permet une acquisition plus rapide mais le retrait du renforçateur entraîne une extinction rapide. C'est un peu la situation "donnant-donnant". Un des désavantages de ce type de programme de renforcement est qu'il donne lieu très vite au phénomène de satiété ou rassasiement qui a pour effet de faire disparaître, de diminuer ou d'améliorer le comportement renforcé.

N.B.: Il faudrait varier la nature des renforçateurs.

8.2 LE RENFORCEMENT PARTIEL OU INTERMITTENT

Ce type de programme est préférable au renforcement continu. On prend comme base de mesure le nombre de comportement émis après lequel le renforcement est donné ou la durée après laquelle le renforcement est donné.

8.2.1 Le renforcement basé sur le temps. On distingue

a.- le renforcement à période de temps fixe (fixed minimum ratio of time)

Exemple: -la paie hebdomadaire ou bihebdomadaire.
-les élèves qui doivent remettre un travail à chaque mois.

Conséquence: Le rendement est assez bas. Le sujet se contente du minimum requis et le fait quelques moments seulement avant le renforcement. L'élève ou le sujet attend le dernier moment et néglige souvent son travail.

b.-le renforcement à intervalles fixes (fixed intervals)

Le renforcement est donné seulement après un certain délai (20 sec. par exemple). Toute réponse donnée pendant ce délai n'est pas renforcée. Celle qui suit immédiatement cette période de temps est récompensée. (Ressemble au premier type de renforcement à période de temps fixe mais ici, le sujet a appris à retenir son geste jusqu'à l'écoulement d'un délai; dans l'autre cas la réponse doit arriver à l'intérieur d'un délai.

Ex: l'élève qui lit à haute voix et qui doit respecter les virgules, les points-virgules, les points qui supposent des délais. L'élève qui respecte les pauses est récompensé. (Cet exemple clairement forcé)

c.-le renforcement au hasard: (variable interval)

Ici le sujet ne peut prévoir laquelle des réponses sera renforcée.

Ex: le professeur qui soumet ses élèves à de fréquents examens dont les élèves ne savent pas lequel va compter et lequel ne va pas l'être.

Conséquences: Amène une certaine dose d'anxiété qui stimule au travail.

Le fait de savoir qu'il y a un degré d'incertitude est essentiel car les gens ne fournissent pas d'effort assez grands lorsqu'ils commencent à croire qu'ils seront récompensés rémunérés) quoi qu'ils fassent. Les individus ne donnent pas leur meilleur lorsqu'ils sont trop "relaxes"; une dose de tension est nécessaire.

8.2.2 Le renforcement basé sur le nombre de réponses données.

a.-le renforcement à moyenne fixe (fixed ratio, proportion fixe).

Il est basé sur le nombre de comportement désiré émis; préconise l'excellence.

b.-le renforcement à moyenne variable (proportion variable) (variable ratio).

Il vise aussi le rendement maximum, donc l'excellence. Ex: renforcer un certain montant de performance. En classe le maître qui corrige le travail de l'élève une fois que celui-ci l'a fini. Selon la qualité du travail, l'élève est autorisé à faire ce qu'il aime ou le recommence.

Conséquences: Le rendement est élevé; le travail est soigné.

Conclusion:

Au début de l'apprentissage, utiliser le renforcement continu, puis à mesure que l'apprentissage augmente, utiliser l'un des programmes de renforcement partiel. Ceci, à la fin, permettra de tirer avantage des vertus du renforcement continu et d'éviter ses désavantages grâce aux programmes partiels qu'on y associe.

9.0 LA MOTIVATION CHEZ LES BÉHAVIORISTES.

Pour les béhavioristes, le problème de la motivation est celui des conditions d'efficacité des renforçateurs. Pour l'apprenant, un renforçateur significatif est régulièrement présenté après un geste approprié va faciliter l'installation et le maintien de ce geste. Les renforçateurs exercent donc auprès de lui un rôle motivateur.

Pour l'expérimentateur ou l'enseignant, motiver son sujet ou son élève va consister essentiellement à trouver et à présenter à ce dernier les renforçateurs les plus significatifs selon un programme de renforcement approprié. Cela comprend non seulement les renforçateurs, mais aussi l'établissement d'une situation favorable. Par exemple, faire du façonnement (shaping) ou créer le besoin de toute pièce chez le sujet. En terme général, la motivation chez les béhavioristes sera essentiellement extrinsèque.

Le conditionnement (en général)
Rôle du renforcement
Établissement de comportements nouveaux
Synthèse sur le conditionnement