LA PONDÉRATION : LOGIQUE OU SORCELLERIE?

CATEGORIES : DATA PROCESSING
27 March 2018

Est-ce que les résultats de cette étude ont été pondérés? Voilà une question qui revient fréquemment sur le tapis. Si vous en doutiez, la pondération représente une étape essentielle de la recherche. Mais que veut-on vraiment dire par pondérer les résultats?

De manière générale, on songe à la pondération dès le début d’une recherche, soit lorsqu’on définit la population à l’étude ainsi que le nombre et les caractéristiques des répondants de l’échantillon. Prenons l’exemple d’une étude sur la satisfaction envers une crème antirides. Il apparait pertinent de se questionner a priori sur la nécessité d’avoir 50 % d’hommes dans son échantillon alors que la clientèle de cette dite crème est constituée de 90 % de femmes.

Dans certains cas,  malgré bien des efforts, on se retrouve a postériori avec un échantillon déséquilibré par rapport à la population à l’étude. Même en prenant bien soin de cibler plus de femmes que d’hommes, il est possible que l’échantillon final soit composé de trop de femmes âgées par rapport aux plus jeunes. L’échantillon est donc déséquilibré en termes d’âges par rapport à la population (oui, oui la prévention des fines lignes commence jeune!). En pondérant, on peut donner un poids mathématiquement plus léger aux résultats des plus âgés et un plus lourd aux plus jeunes afin que l’échantillon revienne à la normale, comme par magie!

Le sexe et l’âge représentent des variables sociodémographiques parmi d’autres pour pondérer les résultats. Le choix des variables de pondération dépend principalement de leur impact sur les résultats de l’étude ainsi que leur disponibilité. En effet, le type de peau apparait une variable de pondération intéressante puisque cela  aurait certainement un impact sur l’évaluation de la crème, mais malheureusement Statistique Canada ne fournit pas la proportion des Canadiens ayant la peau de type mixte!

Bref, la pondération n’a rien de bien sorcier, malgré qu’il y ait quelques éléments à considérer pour ne pas jouer au chaman avec la pondération :

  • Dans la mesure du possible, on tente généralement d’avoir des poids le plus près de 1 afin de limiter l’impact réel sur la marge d’erreur;
  • On ne peut pas accorder à un seul répondant le poids de 100 répondants sans que quelqu’un quelque part ne hausse le sourcil. Généralement, on tolère un poids maximal de 3;
  • Lorsque les paramètres de la population à l’étude ne sont pas connus, il peut être plus prudent de ne pas pondérer.

Ultimement, le but de l’exercice est de s’assurer que le profil de l’échantillon soit semblable à celui de la population à l’étude. Il faut que les résultats soient une bonne illustration de ce qu’ils doivent représenter.