Grande Encyclopédie Larousse 1971-1976Éd. 1971-1976
E

enquête par sondages (suite)

b) Méthode des strates. Certains types d’enquêtes portent sur des ensembles très importants : c’est par exemple le cas des sondages politiques. Pour obtenir un échantillon représentatif, il est évident qu’ici, plus qu’ailleurs, le hasard des rencontres d’un journaliste, même scrupuleux, dans une foule qui sort du métro ne signifie rien : les opinions exprimées ont trop peu de chances d’être représentatives de l’ensemble. Ce type d’enquête nécessite un échantillonnage stratifié, qui consiste à diviser la population en sous-populations, appellées strates, et à choisir un échantillon dans chacune de ces strates. Chaque unité d’échantillonnage de la population est attribuée à une (et à une seule) strate avant qu’on procède à la sélection de l’échantillon, de telle sorte que l’ensemble des strates comprenne la totalité de la population. À l’intérieur de chaque strate, on choisit un échantillon parmi les unités qu’elle comprend, et c’est d’après chacun de ces échantillons qu’on calcule l’estimation pour la strate à laquelle il appartient. Enfin, les estimations séparées de chaque strate sont combinées pour former l’estimation valable pour l’ensemble de la population. On comprend, d’après ces quelques principes, que la méthode des strates est celle qui requiert le plus de manipulation de chiffres et un recours constant aux lois et recettes pratiques de la statistique. Aujourd’hui, le nombre de calculs est tel que le soin de les formuler et de les résoudre d’après les données est confié aux calculateurs électroniques.

Quelques définitions complémentaires

biais (trad. de l’angl. bias) : 1o erreur, indépendante de l’échantillonnage (erreur d’observation, erreur de mesure), qui est due à un désaccord entre les observations et les quantités qu’on cherche à mesurer ; 2o erreur qui joue sur le critère choisi pour constituer un échantillon (par exemple, pour un sondage politique, n’utiliser que le téléphone comme moyen de communication entre enquêteur et enquêté).

écart type : dans une distribution dite normale (c’est-à-dire dont la majorité des valeurs prises par la variable se regroupe de part et d’autre de la moyenne), valeur caractéristique de cette distribution constituant un indice de dispersion de toutes les valeurs possibles de la variable par rapport à la moyenne. L’écart type est la racine carrée de la somme (élevée au carré) des écarts de la variable par rapport à la moyenne, divisée par le nombre total des personnes interrogées (c’est-à-dire le nombre de fois où la variable reçoit une valeur particulière) ; sa formulation mathématique habituelle (simplifiée) est :

Σ étant la somme de quelque chose, x la valeur de la variable, m la moyenne, n le nombre d’expériences, c’est-à-dire le nombre de fois où la variable reçoit une valeur.

échantillon représentatif : nombre N de personnes tel que, d’une part, l’ensemble des réponses qu’elles donnent à un questionnaire composé de questions dont on a dénombré les types de réponses possibles (par exemple : « d’accord », « pas d’accord », « ça, je ne vous répondrai pas », etc.) et, d’autre part, la répartition de ces personnes par type de réponse à chaque question de ce questionnaire décrivent une structure homologue, quoique réduite, à celle que pourrait présenter la population (ou ensemble parent) dont l’échantillon est extrait et qui aurait répondu à ce questionnaire.

étude pondérée, pondération : modification faite systématiquement à un résultat, à une hypothèse, etc., lorsqu’on a pu chiffrer l’erreur initiale (notamment l’erreur d’échantillonnage).

item : chaque question d’un questionnaire — en se référant moins à sa formation qu’à la situation concrète qu’elle implique — qui sollicite une réaction particulière chez l’enquêté (approbation, désapprobation, etc.).

panel : 1o étude de l’évolution des attitudes et des opinions d’un groupe de personnes pendant une période déterminée, par interviews successives à intervalles déterminés ; 2o groupe de personnes qui est étudié suivant cette méthode.

plan d’échantillonnage : ensemble des consignes données aux enquêteurs concernant le choix des personnes qui font partie de l’échantillon.

strate : échantillon réunissant des unités (c’est-à-dire, dans un sondage, des personnes) qui ont des points d’homogénéité déterminés.

variable : grandeur susceptible de varier dans un ensemble donné et tel qu’à chaque valeur de la variable puisse correspondre, au moins théoriquement, un effectif de personnes ou une fréquence. Cette grandeur est en fait l’objectif de l’enquête, c’est-à-dire ce qu’elle se propose de mesurer. Par exemple : le nombre de personnes qui préfèrent l’alcool de vinaigre par rapport au nombre de personnes qui préfèrent l’alcool de vin ; le nombre de personnes dont le revenu est égal ou à peine supérieur au S.M.I.C., qui voteraient pour le candidat X, par rapport au nombre de personnes définies de la même manière qui voteraient pour le candidat Y ; le nombre de personnes qui ne savent pas et le nombre de personnes qui refusent de répondre. (Dans ce cas, il n’y a que deux candidats, mais il pourrait y en avoir davantage, et la variable se complique). Il s’ensuit que la variable ainsi définie est conçue comme la résultante éventuelle de plusieurs facteurs cooccurrents, ayant entre eux des corrélations réelles ou factices, que l’analyse des résultats doit faire apparaître.


Le traitement et l’analyse des observations

Une fois les questionnaires administrés et remplis, les observations recueillies sont traitées selon des règles qui permettent de satisfaire aux conditions de standardisation et de fidélité.


Traitement

• Codage. Le codage consiste à classer en catégories numériques les réponses afin de permettre la présentation quantifiée et l’analyse statistique des résultats. Les questions fermées et préformées sont précodées, et chaque réponse est assignée par avance d’une valeur numérique (par exemple, oui 1). Par contre, lorsqu’il s’agit de réponses à des questions ouvertes, une analyse de contenu est requise. D’une façon générale, on procède de la façon suivante : à partir d’un échantillon de réponses à une question ouverte, on construit tout d’abord des catégories standards, puis les réponses de toutes les interviews sont classées selon ces catégories. Le codage est une opération délicate, car les classements obtenus peuvent varier selon les catégories retenues et les codeurs. Malgré les aménagements pratiques mis au point pour éviter ces biais, toute opération de codage n’en présente pas moins un caractère d’arbitraire.

• Tabulation. Quand toutes les questions ont été codées, leurs valeurs numériques sont reportées sur des cartes perforées mécanographiques. Les observations sont alors prêtes pour l’analyse.