«autocomplétion»

Google revient de guerre

En faisant des suggestions pendant qu’on tape une requête, le moteur de recherche participe à l’écriture de la mémoire collective et de l’histoire. Comment? Une équipe de l’Université de Lausanne et de l’EPFL enquête, entre sciences sociales et Big Data

revient de guerre Google

En faisant des suggestions pendant qu’on tape une requête, le moteur de recherche participe à l’écriture de la mémoire collective et de l’histoire. Comment? Une équipe de l’Université de Lausanne et de l’EPFL enquête, entre sciences sociales et Big Data

Cent ans, une fraction de seconde. D’un côté, le temps écoulé entre le début de la Première Guerre mondiale et sa commémoration. De l’autre, le temps qu’il faut à Google pour nous enlever les mots de la bouche et compléter n’importe quelle requête qu’il nous viendrait à l’esprit de formuler au sujet de ce conflit. Attention: on ne parle pas ici des résultats – c’est-à-dire des liens sur lesquels on peut cliquer pour visiter des pages Web çà et là. On parle d’«autocomplétion»: les suggestions que Google inscrit dans la case de recherche, à mesure que nous y tapons nous-mêmes des mots. Exemple? On écrit «poilus» – et le moteur de recherche complète pour nous. «Poilus Première Guerre mondiale», «poilus d’Alaska», «poilus barbus vêtus de peaux de bêtes», nous souffle-t-il. Vérification faite, les barbus sont hors sujet: ils viennent de La Java des Gaulois , du dénommé Ricet Barrier. «Poilus d’Alaska» renvoie, en revanche, au nom d’une meute de chiens de traîneau mobilisés pendant la Grande Guerre, et au titre d’un documentaire consacré à leur saga, diffusé dernièrement par la chaîne Arte.

Temps long de l’histoire, temps quasi instantané du moteur de recherche, temps court de l’actualité. On est là au cœur des phénomènes étudiés par un projet de recherche intitulé «How Search Engines Frame Collective Memory. WW1 Commemorated and Reprocessed a Century After» («Comment les moteurs de recherche reconfigurent la mémoire collective. La Première Guerre mondiale commémorée et réélaborée un siècle plus tard»), inscrit dans le cadre du programme Cross – Collaborative Research on Science and Society –, lancé en 2012 par l’Université de Lausanne (UNIL) et par l’Ecole polytechnique fédérale de Lausanne (EPFL). Objectif: observer, au cours de cette année de commémorations, comment les suggestions de Google «autocomplètent» les mots clés tapés dans la case de recherche, en participant ainsi à réécrire l’histoire et la mémoire.

L’internaute tape, Google complète, donc. Comment? En tenant compte des recherches récentes des autres utilisateurs, pour commencer. «Celles-ci peuvent être déterminées, au fil des semaines et des mois, par les différents thèmes des célébrations. Ou par d’autres sujets d’actualité qui entrent en résonance avec l’histoire: par exemple la crise ukrainienne, qui ravive les craintes d’une nouvelle guerre mondiale. Ou encore par un buzz populaire: une suggestion qui apparaissait régulièrement était par exemple «la guerre mondiale de 78» – qui est en fait une phrase prononcée par Nabilla dans une émission de téléréalité», signale Olivier Glassey, chercheur engagé – entre autres – sur le terrain de la sociologie de la communication à l’UNIL.

Difficile de savoir précisément comment le moteur de recherche fait des suggestions nouvelles à partir des recherches passées. «Le fonctionnement est assez opaque. On estime que les algorithmes de Google prennent en compte plus de 50 critères. Cela inclut l’emplacement de l’ordinateur sur lequel est tapée la requête, le réseau utilisé, le modèle de la machine, le système d’exploitation, le navigateur internet utilisé», détaille Anna Jobin, chercheuse à l’UNIL et au Collège des humanités de l’EPFL. Les algorithmes – c’est-à-dire les opérations automatiques effectuées sur les données pour produire un résultat – sont eux-mêmes dans un état de perpétuelle métamorphose. «Il y a de petits ajustements une centaine de fois par jour. Sans compter que l’algorithme est programmé pour apprendre et qu’il s’ajuste ainsi constamment lui-même.»

L’histoire, l’actualité, les algorithmes – et nous. «En utilisant le moteur de recherche, chaque internaute contribue par ses recherches et par ses choix à modifier les critères du système. Nous sommes donc tous en quelque sorte les travailleurs de Google. C’est une forme de travail minime, imperceptible et peut-être indolore – mais elle est réelle», reprend Olivier Glassey. Travail collectif que le moteur de recherche met en forme. «Ce qui se joue dans le bref moment de l’«autocomplétion», c’est un processus de reconstruction au présent de la mémoire collective. L’ensemble des suggestions faites par les algorithmes représente véritablement une interprétation et une écriture de l’histoire.»

Concrètement, comment plonge-t-on dans ce cambouis pour voir comment ça marche? «La première étape a consisté à dresser une liste de mots clés. Nous l’avons élaborée à partir de plusieurs sources. Il y a tout d’abord un ensemble de termes répertoriés par le CRID 14-18 – Collectif de recherche international et de débat sur la guerre de 1914-1918 –, qui est un réseau d’historiens critiques», explique l’historienne Stefanie Prezioso, directrice de l’Institut d’histoire économique et sociale de l’UNIL et responsable du projet. A la lettre «A», cette première liste commence par «abeille»: «Dans l’argot des combattants, désigne les balles, sans doute en raison du sifflement qu’elles produisent. On peut aussi rencontrer la variante «frelons», explique le site du CRID 14-18. On trouve là également des notions forgées par l’historiographie de la Première Guerre («brutalisation», «consentement» «culture de guerre»), ainsi que tous les termes désignant l’équipement du poilu.

Une deuxième série de termes inclut les différentes appellations du conflit lui-même («der des ders», «Grande Guerre»). Un dernier ensemble, le plus vaste, comprend «tous les mots et noms propres qui pouvaient potentiellement apparaître au cours des mois. Cela allait des lieux historiques aux acteurs des commémorations, tels que François Hollande, et à des objets relevant de la culture populaire, comme la série télévisée Apocalypse, la Première Guerre mondiale , complète Anna Jobin.

Ensuite? Il faut paramétrer un navigateur web pour ne pas garder d’historique, afin qu’il ne s’auto-influence pas avec ses propres recherches. «Et une fois par semaine, on allait chercher les «autocomplétions» pour chaque expression. A l’arrivée, cela nous a donné quelque 200 000 couples formés à chaque fois d’un de nos mots clés et d’une suggestion de Google. C’est une masse de données énorme. Ni les sociologues, ni les historiens n’ont l’habitude de faire des extractions de données à cette échelle.» Un autre membre essentiel de l’équipe est Frédéric Kaplan, titulaire de la chaire de Digital Humanities à l’EPFL, spécialiste – entre autres – du Big Data. «Parfois, l’interdisciplinarité est un peu une tarte à la crème. Ici, elle est fondatrice de la possibilité même d’étudier les choses», remarque Olivier Glassey.

Conclusions? Pas si vite. Si la collecte des données est achevée, leur extraction et l’analyse des résultats restent à faire – avec la conscience d’avancer sur un terrain que personne n’a encore balisé. «Il n’y a pas de recette. Du point de vue des liens entre mémoire, histoire et Big Data, je crois bien que nous sommes les premiers», avance Stefanie Prezioso. On peut néanmoins placer un cadre de réflexion et avancer quelques hypothèses. Un cadre? Olivier Glassey: «Il y a tout un débat en sociologie et en psychologie sociale sur ce qu’on appelle l’heuristique de la disponibilité. L’idée, c’est que plus on est confronté à une représentation, plus on a tendance à la considérer importante et réelle. Il y a des études, par exemple, sur la manière dont les médias traitent de la criminalité avant des élections: les gens pensent qu’ils vivent une période d’insécurité si on en parle régulièrement, indépendamment de la réalité statistique. Une des questions qui nous intéressent, c’est de savoir si les hiérarchies de visibilité établies par l’«autocomplétion» de Google deviennent des catégories qui s’imposent dans notre manière de penser le monde.»

Une hypothèse? Stefanie Prezioso: «Je reviens à la série de docu-fiction Apocalypse . Elle est emblématique, car ce qu’on y voit à l’œuvre, c’est un phénomène comparable au neutral point of view – NPOV – de Wikipédia. C’est un réaménagement de l’ensemble du champ historique, où des questions qui auraient encore fâché il y a quelques années apparaissent de manière tout à fait lisse. Peut-être le moteur de recherche a-t-il le même effet. Ou peut-être, au contraire, verra-t-on ressurgir le conflit entre différents points de vue; c’est l’un des enjeux de la recherche novatrice que nous menons aujourd’hui.»

On tape «poilus», Google complète: «poilus Première Guerre», «poilus d’Alaska», «poilus barbus vêtus de peaux de bêtes»

Publicité