Grande Encyclopédie Larousse 1971-1976Éd. 1971-1976
C

conditionnement

Établissement d’un certain type de comportement appris, dénommé par Ivan Pavlov réflexe conditionnel ou conditionné et aujourd’hui appelé plus souvent réaction conditionnelle pour éviter l’étroitesse du sens pris par le mot réflexe.


D’une façon plus large, on applique le terme de conditionnement à l’ensemble des phénomènes, des processus, des lois relatifs à la formation et au fonctionnement des réactions conditionnelles.


Le conditionnement classique

Les développements de la recherche postérieurs à Pavlov ont fait que l’on qualifie maintenant de classique la forme de conditionnement découverte par lui.

Le conditionnement classique repose sur une série de faits généralement bien connus : à l’origine se trouve une liaison, établie chez l’individu par l’hérédité, entre un réflexe (ou plus généralement une réaction) et l’agent qui le suscite : ce sont le réflexe et le stimulus inconditionnels. Par ailleurs, on considère un autre stimulus, dit « neutre », en ce qu’il ne suscite pas par lui-même la réaction en cause. Le conditionnement classique consiste dans l’acquisition, par ce nouveau stimulus, de la capacité de susciter désormais la réaction de façon aussi effective que le stimulus inconditionnel ; la condition principale qui rend cela possible est l’apparition conjointe, en contiguïté temporelle, des deux stimuli. Au stade final, le stimulus neutre s’est transformé en stimulus conditionnel (ou conditionné) et produit, avant le stimulus inconditionnel ou éventuellement à sa place, la réaction qui est désormais désignée, elle aussi, comme conditionnelle.

Le nombre de présentations conjointes nécessaires pour aboutir à ce résultat dépend de l’espèce à laquelle appartient l’animal, des caractéristiques individuelles de celui-ci, de l’état momentané dans lequel il se trouve lors de la présentation conjointe des deux stimuli ; il varie aussi selon la nature de ces derniers, en fonction de divers paramètres qui leur sont applicables et enfin d’après le contexte que constitue la situation générale dans laquelle ils apparaissent.

Les modalités de la conjonction temporelle des stimuli influent également sur la facilité du conditionnement : les plus favorables sont celles dans lesquelles le stimulus neutre précède légèrement le stimulus inconditionnel ; si cet intervalle s’allonge, le conditionnement devient plus difficile ; s’il se raccourcit exagérément, il en est de même. Dans le cas où le stimulus à conditionner, au lieu de le précéder, suit le stimulus inconditionnel, il semble bien qu’un conditionnement vrai soit impossible ; mais cette question est controversée.

Les méthodes actuelles d’étude neurophysiologique, et plus particulièrement électrophysiologique, commencent à permettre de suivre de façon directe l’évolution des activités des diverses régions du système nerveux central durant un conditionnement. Après avoir jeté un doute sur le rôle du cortex cérébral, rôle que Pavlov croyait déterminant, elles semblent conduire à le réaffirmer.

On a pris l’habitude d’appeler renforcement le fait de présenter le stimulus inconditionnel après le stimulus neutre (ou conditionnel) ; cet usage est justifié par le fait qu’au cours de la première phase du conditionnement cette présentation produit en effet une augmentation de la force (c’est-à-dire de la fréquence, de l’amplitude ou de la rapidité) de la réaction conditionnelle ; ensuite, celle-ci cesse de croître et, aux oscillations accidentelles près, demeure stable. On continue toutefois à parler de « renforcement » ; celui-ci est en effet nécessaire, même lorsque la réaction conditionnelle est bien établie et consolidée, pour le maintenir. Si on le supprime durablement, la réponse conditionnelle décroît progressivement — tout en continuant à être produite normalement par le stimulus inconditionnel lorsqu’il est présenté isolément ; finalement, l’absence durable de renforcement conduit à la disparition complète de la réaction conditionnelle : c’est l’extinction.

Il faut toutefois souligner que, si, au lieu de supprimer complètement le renforcement, on se borne à le présenter occasionnellement, de façon intermittente, alors la réaction conditionnelle subsiste dans toute sa force ; elle devient même plus résistante à une éventuelle suppression totale ultérieure du renforcement. Un tel renforcement intermittent tire son importance de ce que, dans de nombreuses situations réelles de l’existence des animaux ou de l’homme, on peut constater que la conjonction d’un stimulus conditionnel et d’un stimulus inconditionnel est tantôt présente, tantôt absente ; le fait que le conditionnement subsiste dans ces cas a pour l’individu une grande valeur adaptative.


Le second type de conditionnement

Les caractéristiques fondamentales de la réaction conditionnelle telles qu’elles avaient été établies par Pavlov et son école ont été étendues à peu près simultanément par les physiologistes polonais Jerzy Konorski et Stefan Miller et par le psychologue américain Burrhus Frederic Skinner à un second type de conditionnement, dénommé opérant (Skinner) ou instrumental. Pavlov lui-même n’a jamais reconnu comme réelle la distinction entre deux types de conditionnement et a interprété les faits nouveaux dont il a eu connaissance en termes de conditionnement classique. Toutefois, la réalité et l’originalité du conditionnement instrumental ou opérant sont aujourd’hui reconnues par à peu près tous les chercheurs, même s’ils tentent d’en découvrir, à un niveau plus profond, l’unité fondamentale avec le conditionnement classique.

Le schéma de l’établissement d’une réaction conditionnelle instrumentale ou opérante repose sur l’existence préalable d’une réaction originelle et d’un stimulus renforçateur. Dans l’expérience princeps de Miller et Konorski, la réaction est celle d’un chien qui soulève une de ses pattes antérieures, et le stimulus est constitué par de la viande ou une solution acide ; dans la situation étudiée par Skinner, on utilise une boîte comportant à l’intérieur un petit levier ; si le rat qui y est introduit appuie sur celui-ci, une boulette de nourriture lui est délivrée. Le fait fondamental est que la réaction qui a été suivie de façon régulière par l’administration de nourriture devient de plus en plus fréquente jusqu’à ce qu’elle ait atteint un plateau ; si cette réaction a été suivie par l’arrivée de liquide acide — ou par une autre sorte de stimulus « négatif », tel qu’un léger choc électrique —, sa fréquence décroît et elle finit par disparaître. Cette conjonction de la réaction et du stimulus qui la suit est appelée renforcement ; dans le cas où l’effet produit est une diminution plutôt qu’une augmentation de la force — en fait de la fréquence — de la réponse, on parle, par convention, de renforcement négatif.