Grande Encyclopédie Larousse 1971-1976Éd. 1971-1976
E

enquête par sondages (suite)

• La méthode aléatoire ou probabiliste. L’échantillon est sélectionné selon les règles du tirage au sort, par le jeu du seul hasard : chaque unité de la population a des chances égales de figurer dans l’échantillon. « On dira que l’on a effectué un sondage probabiliste si le prélèvement peut être assimilé à un choix au hasard, c’est-à-dire si l’on peut comparer le choix effectué au prélèvement, les yeux bandés, de boules dans une urne comprenant des boules parfaitement mélangées et assurant à chaque boule la même probabilité d’être tirée au hasard » (Madeleine Grawitz). Diverses techniques permettent d’assurer un tirage au hasard aussi satisfaisant que possible.

a) Sondage aréolaire et méthode par groupe. Quand la population visée est de peu d’importance, par exemple 8 000 ouvriers d’une grosse entreprise, chaque fiche peut être numérotée de 1 à 8 000, suivant n’importe quel ordre. On détermine la taille de l’échantillon à l’aide d’une table de nombres aléatoires (table qui permet de faire correspondre à chaque nombre classé 1, 2, 3, etc., un nombre quelconque et tel que la succession de ces nombres quelconques soit due au hasard, imprévisible, soumise à aucune périodicité, etc.) et l’on retire 400 fiches de l’ensemble de 8 000 suivant l’un des divers procédés d’utilisation de cette table. L’échantillon retenu peut être ici considéré par le mathématicien comme représentatif, et celui-ci a élaboré des formules qui permettent de calculer le risque d’erreur. Ce risque, dit erreur type, est défini comme étant fonction de la distribution plus ou moins homogène des éléments de l’échantillon par rapport à l’ensemble (cette distribution se définit en général par l’écart type). D’un point de vue mathématique, on peut considérer un échantillon comme représentatif, suivant 1, 2, n critères définis, si, à partir d’un nombre donné de personnes interrogées, la répartition des résultats obtenus est « homogène », en ce sens que chaque réponse est relativement proche d’une courbe idéale définie par une fonction. Comment dessiner cette courbe ? En définissant des coordonnées dont l’abscisse représente en valeurs chiffrées la (ou les) réponse(s) des personnes interrogées et l’ordonnée le nombre de l’échantillon, et en rejoignant chacun des points obtenus, on obtient une ligne brisée qui, si l’on augmentait indéfiniment le nombre N de l’échantillon, jusqu’à couvrir intégralement l’ensemble parent, s’approcherait, si on laisse quelques cas aberrants de côté, de plus en plus d’une courbe. (Si la variable est simple, cette courbe est une courbe régulière, dite normale ou de Laplace-Gauss, qui suit le contour d’une cloche plus ou moins aplatie. La courbe de Laplace-Gauss, ou courbe en cloche, est une courbe que l’on peut dessiner a priori si on connaît la valeur de l’écart type.) Dans le cas de l’usine que nous avons évoqué, la distribution (les ouvriers) étant absolument homogène du point de vue du paramètre fixé (le fait d’être ouvrier de l’entreprise), l’approximation (c’est-à-dire le rapport de 400 à 8 000) peut être considérée comme satisfaisante : la courbe obtenue a toutes les chances d’être régulière. Mais il est rare que la réalité sociale permette de se servir de façon immédiate d’une table de nombres aléatoires. Ainsi, pour beaucoup d’enquêtes, il n’existe pas de liste des noms des personnes à atteindre. Par exemple, aucune liste n’est accessible aux enquêteurs qui visent les sous-locataires d’une ville de la banlieue parisienne comprenant pavillons individuels, immeubles traditionnels en copropriété, grands ensembles locatifs privés, H. L. M., etc.

Des solutions approximatives permettent de procéder cependant à l’établissement d’un échantillonnage représentatif ; ainsi, dans ce dernier cas, on peut utiliser la méthode du sondage aréolaire. À partir d’une carte à très grande échelle, on divise la ville en 2 000 îlots, qu’on numérote suivant un plan logique, par exemple de droite à gauche horizontalement par la ligne d’en haut, puis de gauche à droite sur la ligne suivante et ainsi de suite ; on prend alors l’îlot sur 20 et, sur les 100 îlots tirés, on interroge les habitants. Il n’en reste pas moins qu’en fonction du nombre connu d’habitants le risque d’erreur (erreur type), ou, si l’on préfère, les limites de la confiance qu’on peut accorder à la représentativité de l’échantillon, ne peut plus être calculé mathématiquement : le premier moyen qui s’offre est d’augmenter le nombre absolu de l’échantillon, c’est-à-dire d’enquêter de plus en plus de personnes suivant le même principe : par exemple 2 îlots sur 20, 3 îlots sur 30. Mais cela augmente d’autant le coût de l’enquête ! Aussi peut-on essayer parfois de calculer autrement la représentativité. La méthode décrite ci-dessus divise la population visée en groupes, qui ont de fortes chances d’être de tailles inégales. Dès lors, la moyenne de chacun des groupes a, pour celui qui analyse les résultats, une signification très différente si le groupe a 6 ou 600 habitants sous-locataires : la représentativité de l’opinion des individus est très disproportionnée si les groupes sont considérés sur un plan d’égalité. Il convient alors de faire entrer en ligne de compte le nombre absolu de chaque groupe dans le calcul de la moyenne générale, de tenir compte simultanément de chaque courbe décrite par les résultats de chaque groupe, c’est-à-dire, par exemple, de chacun des écarts types, pour obtenir une répartition plus proche de la réalité des résultats (pondération). D’autre part, cette méthode fait apparaître un facteur pratique très important : les réponses données par les personnes dont le nom a été obtenu par la méthode d’échantillonnage par groupe ont souvent une certaine ressemblance entre elles, ressemblance qui tend à reconstituer les groupes eux-mêmes. C’est la simple constatation que les gens qui vivent ensemble tendent à une relative homogénéisation d’opinion ! Cette ressemblance varie suivant les groupes, les questions et peut être mesurée.