Publications

Un logiciel pour «déjargoniser» les articles scientifiques

Pour le quidam, comprendre un article scientifique relève de l’exploit. Développé par une équipe israélienne, un logiciel pourrait simplifier les textes pour les rendre accessibles au grand public

La compréhension d’un article scientifique obéit à une cruelle loi de proximité: plus on s’éloigne de la spécialité, moins on le comprend, notamment à cause des termes techniques utilisés. «Le jargon est très excluant, explique Ayelet Baram-Tsabari, mathématicienne au Technion – Israel Institute of Technology, à Digital Trends. C’est comme un signe au lecteur qui lui dirait: ce texte n’est pas vraiment pour toi, tu ne le comprendras pas de toute façon.»

C’est pour aider les chercheurs à utiliser un vocabulaire plus compréhensible qu’Ayelet Baram-Tsabari et son équipe ont récemment imaginé et créé le De-Jargonizer et publié le principe de son fonctionnement dans la revue PloS One au mois d’août dernier.

Lire aussi: L’avocat qui «traduit» la nouvelle finance pour les banquiers traditionnels

Ce logiciel en ligne permet aux chercheurs de repérer dans leurs textes les mots les plus jargonneux. Il leur suffit ensuite soit de trouver un synonyme plus usuel, soit de définir ces mots dans le texte pour que celui-ci devienne plus lisible pour le commun des mortels.

Le logiciel colore les mots selon leur fréquence d’utilisation dans la langue courante. Si le mot n’est quasiment jamais employé, il devient rouge. Si son utilisation est peu fréquente, il est orange. Il est ensuite très facile de comprendre à quel endroit du texte il faut être plus explicite.

Par exemple, en utilisant le De-Jargonizer sur le résumé de l’article scientifique «A heterochromatin-dependent transcription machinery drives piRNA expression» paru dans la revue Nature, on se rend compte que les auteurs devront faire de sacrés efforts pour le rendre lisible au grand public: plus d’un quart des mots sont en rouge et un cinquième en orange. Seuls 55% du texte sont des termes utilisés couramment, selon le De-Jargonizer.

Technique déjà connue

Pour décider du degré de jargon d’un mot, les chercheurs ont récupéré les 250 000 articles que la BBC a publiés sur son site entre 2012 et 2015. Le logiciel calcule ensuite la fréquence d’utilisation de chaque mot dans cet ensemble de textes. Ce qui permet de trancher si le terme est jargonneux ou s’il est très utilisé dans la vie courante.

Lire aussi: Le jargon anglais impacte le quotidien au bureau

Didier Schwab, maître de conférences à l’Université de Grenoble-Alpes dans le groupe d’étude sur le traitement automatisé des langues, explique au Temps que l’équipe du De-Jargonizer a utilisé une technique connue dans son domaine. «La simplification de texte existe depuis déjà un certain temps. Elle est employée, par exemple, pour aider les personnes en situation de handicap et les enfants ou pour apprendre une langue. La nouveauté, ici, est de permettre au grand public d’accéder à des textes scientifiques.»

En passant un de ses articles dans le De-Jargonizer, Didier Schwab s’est d’ailleurs aperçu qu’«il y a très peu de mots qui ne sont pas du jargon. Quelques exemples m’ont surpris comme «littérature», mais effectivement, j’utilisais ce terme pour désigner la «littérature scientifique» qui n’est pas le sens utilisé couramment.»

L’outil fonctionne donc plutôt bien techniquement même si, pour Didier Schwab, «il reste encore un travail de simplification à faire. Par exemple, il serait intéressant de s’attaquer à la structure des phrases. Pour un profane, il n’est effectivement pas évident de comprendre une phrase longue.»

Conception ringarde

Le De-Jargonizer pose également un regard très technique sur le langage et oublie toute une part des recherches en sciences sociales sur le sujet. Arnaud Saint Martin, sociologue des sciences au Centre européen de sociologie et de science politique, voit dans ce projet «un regard positiviste sur le langage, avec l’idée qu’il existe une transparence du sens de certains mots et pas d’autres».

Pour le sociologue, «ce n’est pas parce qu’on utilise des mots dont tout le monde comprend la définition qu’on va forcément être compris». Bien qu’il trouve la démarche intéressante, il y décèle une «conception ringarde» de la communication scientifique qui fait trop abstraction de la diversité du public concerné, d’où la difficulté de définir un vocabulaire commun.

«Un parti pris élitiste»

De son côté, la linguiste Marie-Anne Paveau considère que le De-Jargonizer «repose sur un choix de vocabulaire arbitraire et discutable». L’anglais de la BBC comme référence «est un parti pris élitiste dans la conception de la langue qui entre en contradiction avec le projet». Selon celle-ci, le mot même de déjargonisation est «assez radical et violent alors que l’utilisation d’un jargon fait partie des bases de la constitution de la science».

Elle n’est, en outre, pas du tout d’accord avec l’identification du jargon par la fréquence. «Certains termes du lexique scientifique ont une fréquence très élevée dans la langue courante», explique-t-elle. Par exemple, le terme «mot», en linguistique, n’a pas la même définition que dans un article de la BBC.

Comme toujours quand on parle langage, et vocabulaire, le débat fait rage entre des visions plus ou moins mécaniques de son fonctionnement et de sa compréhension. Mais le De-Jargonizer a le mérite de relancer le débat sur le langage scientifique et les incompréhensions qu’il peut susciter pour le public profane.

Publicité