Sergey Brin et Larry Page ont beau avoir quitté la semaine passée la tête de la multinationale qu’ils ont créée il y a vingt et un ans, Google continue à innover. Ces jours, le moteur de recherche introduit au niveau mondial, et aussi en Suisse, un nouvel algorithme de recherche. Baptisé BERT, pour «Bidirectional Encoder Representations from Transformers», il doit permettre de mieux comprendre le langage naturel.

Il s’agit d’une mise à jour majeure du moteur de recherche, affirmait la semaine passée lors d’une conférence téléphonique Pandu Nayak, vice-président de la recherche au sein de Google. «Depuis plusieurs années, nous avons voulu réaliser des progrès importants autour de la compréhension du langage naturel, a-t-il détaillé. Auparavant, nous nous basions surtout sur la recherche de suites de mots identiques sur des sites web ou des documents. Nous avons obtenu de bons résultats. Mais ce n’était pas suffisant.»

15% de nouvelles requêtes

Car comme l’a remarqué Google, le moteur de recherche doit être capable de comprendre le sens des mots recherchés pour trouver des synonymes affichés dans des sites web au contenu pertinent. Un exemple: si l’on recherche «comment changer la luminosité sur l’écran de mon ordinateur», le site web affichant la meilleure réponse utilisera peut-être les mots «ajuster» ou «modifier», a poursuivi Pandu Nayak. De plus, a noté le spécialiste, 15% des requêtes que reçoit Google chaque jour sont des recherches qui n’avaient jamais été faites auparavant.

Il fallait du coup modifier en profondeur l’algorithme de recherche, un travail qui a pris plusieurs années. L’axe de recherche de Google s’est orienté vers la mise en lumière des mots les plus importants dans une requête, en faisant moins attention à des mots jugés secondaires. Grâce à BERT, Google va considérer le contexte complet d’un mot, en examinant les mots qui le précèdent et le suivent. Le but est ainsi de comprendre l’intention derrière les requêtes.

De nouveaux «super-ordinateurs»

Sans entrer trop dans les détails techniques, Google s’est basé sur deux travaux de recherche publiés en 2017 et en 2018 pour créer BERT. «Notre but a donc été de comprendre au maximum le contexte et la signification générale d’une demande, a poursuivi Pandu Nayak. Nous avons ensuite entraîné BERT sur d’immenses sets de données pour améliorer nos systèmes de recherche.» BERT a ainsi été lancé en octobre en anglais et il est déployé ces jours pour 70 langues, dont le français. Pour y parvenir, la multinationale a non seulement modifié ses logiciels, mais aussi de nouveaux serveurs informatiques, des «super-ordinateurs» conçus par Google, spécialisés dans le machine learning.

Concrètement, quels sont les résultats obtenus par BERT? Le premier exemple concerne la demande «peux-tu prendre un médicament pour quelqu’un pharmacie». Avant BERT, Google affichait une page parlant, de manière générale, de la façon dont les ordonnances sont traitées. Un contenu sans lien précis avec la demande. Grâce à BERT, Google va proposer une page où le «pour quelqu’un» – élément important de la requête – est pris en compte et afficher une page répondant à cette question.

Amélioration des résultats

Autre exemple: «Est-ce que les esthéticiennes sont souvent debout au travail». Auparavant, Google comprenait en anglais stand (être debout) séparément et proposait des résultats sans aucun rapport avec la demande. Avec BERT, le premier résultat affiché est pertinent. Enfin, la requête «2019 Brésil voyageur aux USA besoin d’un visa» trouve aussi une meilleure réponse avec BERT, l’extrait affiché sous la question lui répondant directement.

Il y a donc du mieux. Mais pas toujours. «Quel Etat est au sud du Nebraska» ne donne pas un bon résultat, malgré BERT, Google affichant des informations sur une localité appelée «South Nebraska», sans aucun lien avec la question. «BERT n’améliore pas tous les résultats», reconnaît Pandu Nayak, qui estime néanmoins qu’entre «un résultat sur dix et un résultat sur cinq ont été significativement améliorés par BERT. C’est donc une modification massive que nous introduisons.» De nouvelles améliorations progressives sont prévues ces prochains temps, la qualité de BERT étant estimée par des cobayes qui attribuent des notes aux résultats.

Ne plus quitter Google?

Reste une question: en affichant de plus en plus des extraits de site web, sous forme de texte ou d’images, sous la requête, Google n’incite-t-il pas les internautes à ne plus cliquer et ouvrir des sites web, et du coup à rester sur la page des résultats? Non, estime Pandu Nayak: «Que ce soit pour l’exemple du visa ou celui des esthéticiennes, l’internaute devra certainement cliquer sur le lien proposé pour s’informer de manière complète.»