Grande Encyclopédie Larousse 1971-1976Éd. 1971-1976
C

conditionnement (suite)

On a de bonnes raisons de rapprocher de cette situation celle du renforcement instrumental positif précédemment décrit. En effet, pour que le chien de Konorski et Miller soulève sa patte et soit alors récompensé par de la nourriture ou pour que le rat de Skinner appuie sur son levier dans les mêmes conditions, il faut que l’un et l’autre soient affamés ; s’ils sont repus, le comportement étudié n’apparaît pas. Or, on peut considérer la faim comme constituant, au même titre qu’une stimulation douloureuse continue, une tension ou un mobile susceptible de mettre l’organisme en mouvement ; de même, on admettra facilement que la consommation de nourriture est, au moins en partie, assimilable à la disparition du stimulus douloureux, en ce qu’elle produit une réduction de la tension existant chez le sujet. La réaction conditionnelle d’échappement a ainsi fourni un schéma général pour une théorie du renforcement instrumental : celui-ci serait dans tous les cas une pure et simple réduction de tension. Cette théorie, illustrée notamment par les noms de C. L. Hull et de N. E. Miller, est, il faut l’observer, très proche, sur ce point précis, des conceptions de Freud concernant le mode d’action de la pulsion. La théorie de la réduction de la tension n’est, toutefois, que l’une des théories du renforcement existantes.

Une autre grande sorte de conditionnement instrumental, d’ailleurs apparentée à la précédente, est constituée par les réactions d’évitement. Dans ce cas, il existe nécessairement un signal — que l’on peut appeler aussi stimulus conditionnel ou encore stimulus discriminatif — qui précède de façon régulière l’apparition d’une stimulation désagréable, qui n’est produite que si aucune réaction ne la précède. Si, au contraire, une réaction déterminée est exécutée par le sujet durant l’intervalle qui sépare le signal du moment de l’occurrence normale de la stimulation négative, celle-ci n’apparaît pas. Le sujet l’évite en produisant le comportement adéquat. On observe assez souvent qu’au cours d’une première phase le sujet ne réagit pas au signal qui annonce la stimulation nocive, mais seulement à cette dernière ; ensuite, la réaction « avance », progressivement, et devient de plus en plus précoce ; l’intervalle — ou la latence — qui la sépare du signal anticipateur se réduit peu à peu, et, lorsqu’il est devenu suffisamment court, le sujet ne reçoit plus la stimulation nocive. Tous les conditionnements d’évitement ne s’établissent pas suivant ce schéma, mais c’est le plus général lorsque la situation et la réaction sont nouvelles pour le sujet. La raison en est que celui-ci doit avoir fait au moins une fois l’expérience de la stimulation négative pour pouvoir apprendre à l’éviter. En revanche, une fois la réaction d’évitement acquise et stabilisée, il peut arriver que le sujet ne refasse plus jamais cette expérience. Il y a là un paradoxe qui naît du fait que c’est justement la suppression, donc l’absence, du stimulus nocif qui est l’événement renforçateur ; un conditionnement d’évitement réussi n’est ainsi, par son existence même, plus jamais renforcé. On peut alors se demander pourquoi il ne s’éteint pas spontanément ; en fait, dans de nombreux cas, c’est bien ce qui se produit : peu à peu la réaction cesse d’être exécutée par le sujet ; mais, du même coup, la stimulation déplaisante se produit de nouveau, et cela fait réapparaître la réaction, qui, à son tour, supprime la stimulation et ainsi de suite.

Toutefois, lorsque la stimulation nocive est très intense, la réaction d’évitement peut demeurer extrêmement stable et ne pas régresser ; le paradoxe prend alors une autre forme. Supposons, en effet, une situation qui donne naissance à un conditionnement d’évitement ; supposons ensuite que cette situation objective se modifie, que le stimulus signal continue à apparaître, mais que la possibilité matérielle de la stimulation nocive ait disparu. L’observateur extérieur sait que, si le sujet — animal ou homme — cessait de réagir, il ne se passerait rien de fâcheux pour lui ; mais, du fait même que la réaction est solidement établie, celle-ci ne lui laisse pas l’occasion d’en faire l’expérience. On a pu voir ainsi des animaux conditionnés à éviter une stimulation électrique assez forte continuer à réagir jusqu’à 300 ou 400 fois après que le courant avait été coupé. Ce résultat, comme on le soulignera plus bas, peut jeter quelque lumière sur certains comportements névrotiques.

L’étude détaillée, psychologique et psychophysiologique, des conditionnements d’évitement a permis d’établir qu’ils reposent sur un double — et sans doute un triple — processus : en premier lieu, il s’établit une réaction conditionnelle classique de peur, dont le signal annonçant le stimulus nocif est le stimulus conditionnel et dont la douleur ou le déplaisir constituent les éléments inconditionnels. C’est à partir de cette peur conditionnelle que se développe ensuite la réaction d’évitement proprement dite, et, tant que la première subsiste, la seconde se maintient également.


Les caractéristiques communes des deux types de conditionnement

En dépit des différences que nous avons soulignées plus haut concernant les modalités du renforcement (et peut-être sa nature) pour les deux types de conditionnement, on peut les ranger dans une même classe d’apprentissages en raison des nombreuses caractéristiques qui leur sont communes.

Au premier rang de celles-ci, on doit citer le rôle de la répétition ; il a déjà été mentionné à propos du conditionnement classique, et on peut le rappeler pour le conditionnement instrumental, qu’une conjonction unique peut suffire à l’établissement d’une réaction conditionnelle ; mais, le plus souvent, il faut un nombre plus ou moins élevé de répétitions.

Une deuxième caractéristique a trait à l’intervalle de renforcement. Il faut observer que, dans le conditionnement instrumental ou opérant, il sépare la réaction du renforçateur alors que, dans le conditionnement classique, il se trouve entre le stimulus à conditionner (ou conditionnel) et le renforçateur. Mais, dans les deux cas, il existe un optimum d’environ une demi-seconde, et le raccourcissement ou surtout l’allongement de l’intervalle rend le conditionnement plus difficile.