ajustement statistique (suite)
Introduction
Quel que soit le phénomène étudié, la liaison entre sa mesure Y et celle, X, d’une autre variable, à laquelle on veut associer ses variations, est, en général, définie par une série de couples d’observations (x, y) auxquels correspond, comme représentation graphique, un ensemble de points de coordonnées x, y. Ainsi, une série chronologique n’offre qu’une suite d’images instantanées du phénomène étudié, même s’il varie de manière continue comme la température en un lieu donné en fonction de l’instant. De même, l’observation, dans un groupe d’adultes, de la distribution de leurs tailles ne peut donner qu’un ensemble de couples (x, y), y étant le nombre des individus de taille x. Très généralement, la représentation graphique de la liaison apparente entre les deux variables, par une ligne brisée joignant les points (x, y), présente des irrégularités (« dents de scie ») qui s’opposent au sentiment intuitif que l’on a d’un phénomène variant de façon continue. Les causes de ces irrégularités sont nombreuses : erreurs d’observation ou de mesure, fluctuations d’échantillonnage (les unités statistiques observées ne représentant qu’imparfaitement la population dont elles sont issues), facteurs accidentels ou secondaires par rapport à la liaison que l’on veut mettre en évidence (influence d’une variable autre que la variable X prise en considération). La notion de continuité de la dépendance envisagée conduit à essayer d’éliminer des observations tout ce que l’on peut raisonnablement considérer comme étranger au phénomène étudié. Pour cela, on substitue aux valeurs y observées de nouvelles valeurs y′ définies, de manière à réaliser, aussi objectivement que possible, cette élimination. Cette opération est désignée sous le nom d’ajustement ou, dans certains cas, de lissage.
Réalisations pratiques
Ajustement mécanique
Cette méthode est plus particulièrement utilisée pour le lissage de séries dans lesquelles les valeurs successives de la variable x sont équidistantes (séries chronologiques). Elle consiste à remplacer chaque valeur yx de la série observée par une valeur y′x calculée en fonction de yx et de quelques valeurs voisines de part et d’autre. Le choix de la combinaison adoptée pour le calcul de y′ dépend de l’hypothèse admise sur la forme de la variation réelle de y au voisinage de la valeur particulière envisagée pour x. Si cette variation est approximativement linéaire, à des variations aléatoires près, positives ou négatives, le calcul de la valeur y′, dépendant de la somme d’un certain nombre de ces effets aléatoires, tend à en minimiser l’influence ; on est ainsi amené à la méthode de lissage par moyennes mobiles (simples ou pondérées). À chaque groupe de n observations successives (x, y) on substitue des couples (x′, y′) tels que x′ soit la médiane des valeurs x et y′ la moyenne arithmétique des valeurs y correspondantes.
Ajustement graphique
Ayant placé sur un graphique les points M (x, y) correspondant à la série, on trace, à main levée, une ligne continue laissant certains de ces points au-dessus, d’autres au-dessous, mais s’écartant le moins possible de la ligne polygonale obtenue en joignant, par des segments de droite, les points correspondant à des valeurs successives de x. Malgré son caractère subjectif, la méthode graphique permet de ne pas tenir compte de certaines irrégularités accidentelles correspondant à des causes connues extérieures à la liaison que l’on veut mettre en évidence (par exemple, congés ou grèves dans une série mensuelle d’indices de la production industrielle).
Ajustement analytique
La méthode d’ajustement analytique suppose le choix préalable d’un certain type de fonction y = f(x) susceptible de s’adapter de façon satisfaisante aux observations. Ce choix étant fait, soit pour des raisons graphiques, soit pour des raisons techniques inhérentes à la nature du phénomène étudié, on détermine les coefficients qui préciseront la fonction y = f(x), de façon à obtenir la meilleure concordance d’ensemble entre les résultats observés yx et les résultats calculés y = f(x). Divers procédés peuvent être employés pour rendre minimal l’ensemble des écarts yx – f(x). On utilise généralement la méthode des moindres carrés, dans laquelle on détermine les coefficients de la fonction f(x) par la condition que la somme des carrés des écarts Σ[y – f(x)]2 soit minimale.
Chacune de ces méthodes présente un certain caractère arbitraire : choix du type de moyenne et du nombre de termes utilisés dans son calcul pour un ajustement mécanique, jugement et habileté du dessinateur pour un ajustement graphique, choix du type de fonction y = f(x) pour un ajustement analytique. Le choix de la méthode à employer dépend de l’information préalable que l’on possède sur la nature du phénomène étudié et des variations que l’on souhaite éliminer ou mettre en évidence, ainsi que du but poursuivi, allant de la simple présentation graphique d’ensemble à l’utilisation dans des calculs ultérieurs.
E. M.