statistiques

La vérité cachée des chiffres

Les chiffres et statistiques sont parfois utilisés à mauvais escient dans la presse, la publicité ou le monde politique, par erreur ou par manipulation délibérée. De son côté, le public peine parfois à appréhender ces données. Les experts parlent même d’«innumérisme», l’équivalent mathématique de l’illettrisme. Galerie d’exemples commentés par Frédéric Schütz, consultant en statistiques au SIB, l’Institut suisse de bioinformatique

Proportion de chômeurs par tranche d'âge en avril

(Source: PME Magazine; sources des données = SECO) «On touche là au problème le plus souvent rencontré: on compare des choses incomparables, ou on place des chiffres dans de faux contextes, explique Frédéric Schütz. En effet, les trois parts du camembert contiennent un nombre différent de classes d’âge (10 classes pour la part bleu-clair, 25 pour la bleu-foncé, etc.). Or si on dénombre les chômeurs dans chaque part, il est évident qu’ils seront plus nombreux dans la catégorie où la population est la plus grande (les 25-49 ans). Avec ce graphique, on ne peut donc pas calculer de «proportion de chômeurs par tranche d’âge», mais seulement – et cela ne veut plus dire grand-chose – le nombre de chômeurs dans des regroupements d’âges disparates.»

Consommation par personne en kilos

(Source: Le Matin / Frédéric Schütz) Deux problèmes dans ce graphe, selon Frédéric Schütz : «Le premier est que l’échelle sur l’axe des abscisses (horizontal) n’est pas constante: chaque trait marque d’abord une décennie, puis seulement une année. L’interprétation finale peut être faussée. Car si l’on regarde les données brutes, il serait difficile de conclure à une stabilité entre les années 1990 et 2007… Le deuxième problème concerne le «bruit» (les légères oscillations de la courbe) entre chaque point observé depuis l’année 2000: ces variations ne devraient pas exister, puisque les quantités considérées sont des valeurs annuelles (les points)» Pour y voir plus clair, le statisticien a contacté le quotidien qui a publié ce graphique: «Le journaliste et la graphiste n’avaient aucune volonté d’induire le lecteur en erreur, raconte-t-il. Ils m’ont dit avoir juste voulu «faire rentrer» les données dans le graphe de manière esthétique, pour éviter que les données ne soient trop lisses (d’où les variations rajoutées entre 2000 et 2010)»

Les impôts à Genève et dans d'autres villes

(Source: Tribune de Genève) «A nouveau, comme dans l’exemple précédent, l’échelle de l’axe des abscisses n’est pas régulière, ce qui peut laisser l’impression d’une progression plus ou moins constante, ce qui n’est en réalité pas le cas...», relève Frédéric Schütz.

+40% sur sept ans

(Source: PME Magazine) «Dans ce graphe, rien n’est faux en soi, dit Frédéric Schütz. Mais il n’est pas sûr que le message – «Augmentation du prix moyen des montres de 40% sur sept ans» – soit bien passé. Le graphiste à voulu associer cette augmentation au diamètre des montres, dont on peut vérifier qu’il a bien crû de 40%. Mais ce que le lecteur voit de prime abord, c’est l’augmentation de la surface des horloges qui, elle, n’est pas de 40%, mais proche de 100%...». Par ailleurs, «les aiguilles des montres ont été ajoutées dans un but purement esthétique, mais elles peuvent induire le lecteur en erreur en donnant l’impression qu’elles contiennent de l’information également.»

Impression d'écran d'une page du journal Sonntag avec un graphique

(Source: Sonntag) Le sous-titre de l’article indique que «chaque semaine, une personne meurt des suites d’un accident provoqué par un conducteur de voiture âgé de plus de 70 ans». Le journaliste est arrivé à cette conclusion par des divisions de chiffres qui, en réalité, cachent une réalité plus complexe. Ce qui a amené l’Office fédéral des statistiques (OFS) à rectifier: «Les données de la statistique des accidents de la circulation routière recensent d’une part les victimes des suites d’accidents impliquant tous les moyens de transport routiers, qu’ils soient motorisés (par exemple les voitures de tourisme, les bus) ou non-motorisés (cyclistes, piétons), et d’autre part toutes les responsabilités supposées possibles pour un accident (plusieurs personnes peuvent être supposées responsables pour un même accident). Dès lors, les données récoltées par l’OFS concernant les accidents de la circulation routière ne permettent pas d’aboutir aux conclusions présentées dans l’article mentionné ci-dessus.»

Graphique sur le financement de la Confédération par l'EFPL

(Source: EPFL) «Dans le graphe de gauche, qui montre les financements acquis par une haute école de Suisse, il est très probable que les deux courbes ont été mise ensemble à dessein, en dépit du fait que les échelles sur les côtés sont différentes (une progression de 10 millions sur l’une correspond à une progression de 20 sur l’autre), estime Frédéric Schütz. Nous sommes dans un contexte académique dans lequel les financements privés prennent de plus en plus d’importance et sont bien vus. A priori, il n’y avait aucune raison de faire se croiser ces deux courbes. Mais là, l’idée est de faire croire en apparence que les deux sources de financement sont de même ordre. Or si l’on place les mêmes courbes sur une seule échelle, on voit nettement la différence…» Nicolas Henchoz, alors porte-parole de la haute école en question explique de son côté: «Montrer le croisement des courbes n’était pas un objectif. En revanche, montrer leur évolution respective est évidemment intéressant. Si on montre les courbes dans leur échelle totale, on obtient une représentation rigoureuse par rapport aux chiffres absolus, mais on diminue drastiquement la possibilité de percevoir les évolutions et de repérer des tendances, des événements, etc. Elle devient donc beaucoup moins riche en informations.»

Voilà comment on compte correctement

(Source: tout ménage de l’UDC distribué durant l’été 2010) Trouvé dans un tout ménage distribué par l’Union démocratique du centre: «Voilà un cas classique de manipulation peut-être naïve des chiffres – mais est-ce vraiment seulement une erreur?, dit Frédéric Schütz. Dans l’exemple, aux étrangers officiellement recensés sont ajoutés les sans-papiers, les frontaliers, les requérants d’asile. Mais si l’on refait le calcul, on s’aperçoit que ces mêmes ajouts ne sont pas faits au total de la population suisse, utilisé pour calculer le pourcentage. Si on corrige cela, on obtient le résultat suivant: 2’092’309/7’701’856 (soit la population suisse)+200’000+212’566+40’797) = 25.6%. Et non 27,2%!» 

La proportion de Musulmans double tous les dix ans en Suisse

(Source: annonce publicitaire du Comité contre les naturalisations en masse, proche de l’UDC, publiée dans plusieurs médias en 2004) «Dans ce cas [une annonce publicitaire insérée dans les médias suisse en 2004 par un grand parti national, ndlr.], les données ne sont plus présentées, elles sont inventées, regrette Frédéric Schütz. Les deux premiers points (verts) sont réels, alors que les suivants (rouges) sont des extrapolations, au mieux basées sur ce qui a été observé dans un seul canton, Zurich. Or il n’y aucun raison de penser que ces extrapolations sont fondées, encore moins applicables à toute la Suisse.» De plus, en suivant la même logique, le prochain point devrait indiquer un pourcentage de 144% de musulmans en Suisse en 2050, chiffre évidemment impossible.

Graphique sur le total des délits enregistrés dans la statistique fédérale

(Source: Olivier Gueniat, «La délinquance des jeunes», PPUR, 2007) Frédéric Schütz: «Lorsque l’on veut montrer une tendance (un accroissement, une baisse), il est souvent possible de choisir les points de départ et de fin des données, comme ici le total des délits entre 2000 et 2004. Or si l’on regarde les données sur une plus grande période, on s’aperçoit que, finalement, la tendance mentionnée n’est pas extraordinaire, même s’il y a effectivement eu un «trou» vers l’année 2000.»

Graphique sur le nombre annuel d'étrangers naturalisés égale la population de la ville de Lucerne

(Source: Office fédéral des migrations) Plusieurs observations sur ce graphe: «La première est que la gradation commence à 5000. Cela donne visuellement l’impression d’une fulgurante progression entre la première et la deuxième valeur, alors qu’il n’y a entre les deux «que» un multiple 2, dit Frédéric Schütz. A nouveau, les années de départ et de fin sont choisies de manière à étayer le propos selon lequel il y une explosion récente de naturalisation. Ce n’est pas faux, mais en regardant dans le passé, il est intéressant de voir que ce n’est pas la première fois… Mais surtout, le problème le plus sérieux, est qu’il faudrait remettre les chiffres dans leur contexte – c’est un grand classique: entre 1991 et 2007, la population totale en Suisse a fortement augmenté. Rapportées à la population du pays, 10000 naturalisations en 1991 ne représentent pas le même pourcentage que 10000 naturalisations en 2007.»

Sauter le petit-déjeuner rend précoce sexuellement au Japon

(Source: Reuters) «Il faut toujours se méfier des études statistiques qui veulent mettre en relation deux idées ou affirmations, comme ici, dit Frédéric Schütz. Même si une corrélation semble apparaître dans les statistiques récoltées – «Les adolescents japonais qui ne prennent pas de petit-déjeuner ont tendance à avoir leur première expérience sexuelle plus tôt que les autres» – cela ne veut pas encore dire qu’il y a un lien de causalité entre les deux affirmations.»

 

Publicité