Qu’est-ce qui distingue une Marilyn Monroe d’un Attila? Pas grand-chose, génétiquement du moins. L’ADN de ces deux figures emblématiques est identique à 99,9%. Avec la progression des méthodes de séquençage du génome, des chercheurs du monde entier traquent les variations – parfois infimes – qui sont à l’origine de la diversité des individus et des espèces. Des nouvelles données sont publiées pour ainsi dire tous les mois.

A titre de comparaison, l’ADN de la tomate commune diffère de 0,6% de celui de la tomate sauvage et de 8,7% de celui de la pomme de terre. Si le génome de deux êtres humain diverge d’environ 0,1% en moyenne, la distance qui les sépare de leur plus proche cousin le chimpanzé est estimée à 1,37%. Le gorille se situe un peu plus loin sur l’arbre généalogique familial avec 1,75% de différence. L’orang-outan est à 3,4%. Mais que veulent dire ces chiffres?

L’ADN humain est composé de 3,2 milliards de briques de base – des molécules – que l’on désigne par les lettres A, C, G, T. Lorsqu’on aligne le génome de deux personnes, comme si l’on mettait deux pages de textes très similaires côte à côte, on trouve en moyenne une lettre de différence toutes les mille lettres. Soit un écart de 0,1%. Si cette méthode donne une information sur le degré de parenté de deux individus ou de deux espèces, elle ne tient compte que d’un seul type de variation génétique. Il s’agit des «fautes de frappe» où une lettre est remplacée par une autre.

Mais il arrive aussi que quelques lettres soient répétées un nombre variable de fois d’un individu à l’autre. Voire tout un gène ou des passages de centaines de milliers de lettres. «Il y a de tout, souligne Denis Duboule, directeur du Pôle de recherche national Frontiers in Genetics. Des répétitions, des inversions, des déplacements, des cassures…»

«Lorsque l’on confronte l’ADN de l’homme et du chimpanzé, il y a parfois des pages, voire des chapitres supplémentaires dans l’un des deux, ajoute Alexandre Reymond, du Centre intégratif de génomique de l’Université de Lausanne (Unil). Quand on dit qu’ils sont identiques à plus de 98%, il ne s’agit que de la comparaison des pages qui sont très similaires.» D’une espèce à l’autre, il n’est en outre pas rare que l’arrangement des chromosomes, voire leur nombre, diffère. «On ne compare que ce qui est comparable», poursuit le généticien.

«Comme du français et de l’italien, illustre Marc Robinson-Rechavi, du Département d’écologie et évolution de l’UNIL. Si on essaie de confronter un texte français à du chinois, cela devient très difficile. C’est pourquoi on ne compare en général un mammifère qu’à un autre mammifère. Entre l’homme et le poisson, par exemple, il reste beaucoup de similarités au niveau des gènes, mais les parties de l’ADN qui ne servent pas à produire des protéines sont trop différentes pour être comparées.» Ces dernières étant vraisemblablement moins directement impliquées dans le fonctionnement de l’organisme, elles sont plus susceptibles de se modifier au fil du temps.

Entre êtres humains, la différence est bien sûr variable. Les vrais jumeaux ont un patrimoine génétique identique. Quant à la distance maximale entre deux individus de notre espèce, elle est difficile à évaluer, mais elle devrait rester faible. «Peut-être 0,2%», estime Manolis Dermitzakis, du Département de médecine génétique et développement de l’Université de Genève.

Contrairement aux autres animaux, le génome de référence humain – celui auquel les autres sont comparés – n’est pas celui d’un seul individu. C’est une sorte de patch­work de plusieurs personnes d’origines différentes, pour être politiquement correct. Il est toutefois intéressant de noter que les distances génétiques ne respectent pas toujours les distances géographiques. «Une étude a montré qu’il peut y avoir plus de diversité entre différents groupes de Bushmen d’Afrique australe, qu’entre un Européen et un Chinois, souligne Alexandre Reymond. Ceci parce que les populations qui sont sorties d’Afrique sont issues de petits groupes qui constituent des goulets d’étranglement génétiques.»

Parmi les «fautes de frappe» qui distinguent un génome d’un autre, certaines n’entraînent aucune conséquence. En effet, même au sein des séquences codantes, des lettres peuvent être modifiées sans que cela ne change la protéine transcrite au final, rappelle Denis Duboule. En outre, une grande partie de ces variations tombe dans les parties non codantes du génome, c’est-à-dire en dehors des gènes. Jusqu’ici, peu d’importance a été accordée à ces segments, parfois qualifiés d’ADN poubelle, qui constituent 98% de notre patrimoine génétique. Mais les scientifiques sont en train de revenir sur ce jugement.

Cela a notamment encouragé les études dites «d’association pangénomique» qui, au lieu de chercher la cause d’une maladie dans un seul gène, portent sur l’ensemble du génome. L’ADN de vastes cohortes de patients est comparé à celui de personnes en bonne santé, pour tenter d’identifier l’origine d’une pathologie.

Si l’on s’en tient toutefois à la partie la mieux étudiée – les gènes – la diversité n’est pas également distribuée. «Certains gènes qui sont responsables de fonctions importantes de la cellule, comme la division, par exemple, ne varient pour ainsi dire pas», relève Manolis Dermitzakis. Une modification qui touche le développement de base de l’embryon a en effet très peu de chances de ne pas être directement délétère. Il y a des domaines où la diversité est en revanche favorisée. Comme le système immunitaire, afin d’affronter les différents virus ou bactéries, ou la reproduction, en raison de la pression compétitive.

Une étude parue il y a un an dans PLOS Genetics a identifié 60 gènes apparus depuis que les êtres humains ont divergé des chimpanzés. Ceux-ci sont principalement exprimés dans le cortex cérébral et les testicules. L’analyse du génome des différents groupes de Bushmen a pour sa part révélé des variations dans des gènes impliqués dans la croissance, les fonctions musculaires et le système immunitaire.

Ces groupes se sont vraisemblablement séparés il y a quelque 30 000 ans. Qui sait à quand remonte le dernier ancêtre commun à Marilyn Monroe et Attila? Combien de temps a-t-il fallu pour différencier la blondeur de l’une de la noirceur de l’autre? Peut-être pas tant que ça, d’autant que la première était somme toute très artificielle et la seconde peu documentée.

Qui sait à quand remonte le dernier ancêtre commun à Marilyn Monroe et Attila?