Election

Pourquoi les sondages se sont trompés

Les sondages d'opinion ont largement sous-estimé le score de Donald Trump à l'élection présidentielle. Lundi, les grands journaux américains donnaient quatre points d'avance à la candidate démocrate. Où les sondages ont-ils échoué? Décryptage

Tout au long de la course à la présidence, les sondages ont désigné Hillary Clinton gagnante, malgré un écart qui se réduisait. A la suite du résultat officiel, l’écart entre les deux candidats, même s’il semblait important, est resté dans la marge d’erreur classique de 2 à 3%. «Nous ne sommes donc pas aussi loin que ce qu'on nous prédisait», commente Dominique Joye, professeur à l'UNIL et spécialiste du domaine. Des récoltes de données Etat par Etat auraient permis une meilleure analyse que les sondages nationaux. Globalement, les partisans démocrates ont été plus représentés dans la recherche d'opinions. «Avaient-ils plus facilement accès à internet? Etaient-ils davantage à la maison? Ou avaient-ils plus envie de répondre que les sondés républicains? Tout cela a biaisé leur représentativité», explique encore Dominique Joye. «Un sondage coûte cher et demande du temps. Les enquêtes basées sur un laps de temps plus court entraînent inévitablement des biais de sélection».

L’intelligence artificielle n’a pas fait mieux

Autre approche, mais résultats similaires au Social Media Lab de l'EPFL. Son modèle de prédiction basé sur les avis exprimés sur le Net s'approchait, comme les sondages classiques, à 2% près du résultat. Mais, en faveur de la démocrate. «Nous ne nous sommes pas trompés si nous regardons les votes du public», commente sa vice-présidente, Adrienne Corboud Fumagalli. Confirmation de CNN: pour la chaîne, Hillary Clinton a remporté plus de voix que Donald Trump. Mais, ce qui a fait pencher la balance, c'est le nombre de grands électeurs, un élément dont l’EPFL n'a pas assez tenu compte, croyant la marge du vote populaire suffisante.

La méthode de calcul se base sur l’intelligence artificielle et consiste à analyser ce qui se dit sur internet, soit des dizaines de millions de données, pour en tirer une tendance. «Le Web recense une grande partie des opinions avec certainement une domination de certaines communautés comme les jeunes», admet-elle. Principaux contributeurs sur les réseaux sociaux, ils étaient 54% à voter en faveur de la démocrate.

Une seule prédiction juste

Lundi, un sondeur annonçait le républicain en tête avec 3,2 points d’avance sur la démocrate. Les sondés étaient recrutés au hasard dans le pays, mais des tablettes étaient offertes à ceux qui n'avaient pas accès à internet incluant ainsi tous les groupes sociaux, explique son auteur Arie Kapteyn au journal français Libération. Une démarche unique et difficile à généraliser, qui ne rassure pas  quant à la fiabilité générale des sondages.


 A lire aussi: 

Publicité