D’où vient le SARS-CoV-2? Quand est-il apparu? Comment est-il arrivé jusqu’à nous? Les secrets du nouveau coronavirus sont tapis dans son génome. Encore faut-il savoir les dénicher. Pour cela, des scientifiques comparent les séquences génétiques des virus prélevés chez les patients atteints de Covid-19, à la recherche de toutes petites variations qui leur permettent de reconstruire l’arbre généalogique du virus, avec l’aide de puissants outils informatiques.

Lire aussi:  Qu’est-ce qui nous attend? Un «guide du Covid-19» pour alarmer et donner espoir

Ce domaine d’étude, la phylogénétique, constitue la spécialité du chercheur suisse François Balloux. Directeur de l’Institut de génétique de l’University College de Londres, il vient de publier dans la revue Infection, Genetics and Evolution une étude portant sur la comparaison de plus de 7000 séquences génétiques du nouveau coronavirus, récoltées à travers le monde entier et mis à la disposition des chercheurs sur le site collaboratif Gisaid. Son compte Twitter est très suivi avec plus de 30000 abonnés.

Le Temps: Le SARS-CoV-2 subit-il fréquemment des mutations?

François Balloux: Les mutations sont des erreurs qui se produisent aléatoirement lorsque les virus répliquent leur génome. Elles surviennent plus ou moins fréquemment selon les organismes. Le SARS-CoV-2 a un taux de mutation assez classique pour un virus à ARN, plus bas que ceux du VIH ou de la grippe, par exemple. Il n’a accumulé que peu de variations depuis l’émergence de la maladie chez l’être humain. Nous avons comparé des virus qui ont été recueillis très tôt au cours de la pandémie et d’autres beaucoup plus récemment. Un virus collecté aujourd’hui est à une distance d’une dizaine de mutations en moyenne depuis l’ancêtre commun, c’est-à-dire le virus ayant initialement sauté dans la population humaine depuis un réservoir animal. Ce qui plaide en faveur de l’hypothèse d’un ancêtre commun relativement récent.

Comment faites-vous pour dater l’émergence de ce pathogène chez l’être humain?

Plus on avance dans le temps, plus les virus accumulent de mutations, par rapport à la séquence génétique de leur ancêtre commun. Dès lors qu’on connaît la fréquence de survenue de ces mutations, on peut remonter en arrière et calculer en combien de temps elles sont apparues. On reconstitue ainsi progressivement l’arbre phylogénétique du virus, avec l’ancêtre commun au niveau des racines et tous ses descendants placés sur des branches, dont la longueur est proportionnelle au nombre de mutations qu’ils ont accumulées. Avec cette technique, nous avons estimé la date du saut du virus de l’animal à l’être humain autour des mois d’octobre ou novembre 2019, ce qui correspond à différentes autres estimations. C’est aussi cohérent avec la date du premier cas identifié chez un humain, le 17 novembre en Chine. Notre étude infirme par contre certaines spéculations selon lesquelles le nouveau coronavirus aurait circulé depuis bien plus longtemps, sans avoir été détecté.

Vos données vous renseignent-elles aussi sur l’origine géographique du nouveau coronavirus?

Oui, il n’y a pas de doute sur le fait qu’il provienne de Chine. Tous les premiers échantillons de SARS-CoV-2 sont chinois. Les études génétiques montrent clairement que les virus récoltés ailleurs dans le monde dérivent de ces premiers virus issus de Chine.

Le site internet Nexstrain, qui se base sur l’analyse des génomes partagés par la communauté scientifique, permet de visualiser comment le virus s’est ensuite répandu à travers le monde. On peut constater que les échanges entre pays ont été multiples!

Oui, dans la plupart des pays pour lesquels nous disposons de suffisamment de données, aux Etats-Unis, en Grande-Bretagne ou en Islande notamment, nous constatons que la diversité génétique des virus récapitule leur diversité au niveau mondial. Alors qu’en Chine, seule une fraction de cette diversité globale est présente. Ces observations suggèrent que chacune des épidémies locales a été initiée par un grand nombre d’introductions indépendantes du virus, probablement très tôt dans la pandémie, quelques semaines après son démarrage en Chine. Dans ces circonstances, il n’est pas étonnant qu’un patient français ait déjà été atteint par le Covid-19 au mois de décembre, comme cela a été récemment suggéré par un médecin qui a réanalysé des prélèvements chez un de ses anciens patients. Rien qu’en Islande, nous estimons qu’il y a eu entre 50 et 60 introductions différentes du nouveau coronavirus: il y a donc beaucoup de «patients zéro», il est inutile de chercher les coupables!

Certaines zones du génome du SARS-CoV-2 semblent plus enclines à muter que d’autres, que peut-on en conclure?

En effet, sur les 30 000 paires de base [les lettres qui composent la séquence génétique, ndlr] du génome du nouveau coronavirus, nous avons relevé des mutations sur 4000 sites, parmi lesquelles 200 sont récurrentes. Le fait qu’elles apparaissent à de multiples reprises dans des zones géographiques différentes ne peut pas être dû au hasard. Ces mutations permettent sans doute aux virus de s’adapter à leurs nouvelles conditions de circulation; il n’y a pas encore si longtemps, ils ne contaminaient que des animaux.

Ces mutations pourraient-elles rendre le virus plus virulent?

Il n’y a pas de signe que ce soit le cas. Et d’un point de vue évolutif, il n’y a pas de raison pour que cela se produise, car le virus circule actuellement très bien dans la population, en étant véhiculé par un grand nombre de personnes peu symptomatiques. Les virus plus virulents comme Ebola sont souvent plus vite circonscrits, ce qui n’est pas favorable à leur propagation. Il est possible que la population de SARS-CoV-2 évolue en différentes lignées, caractérisées par des niveaux variables de virulence et de transmissibilité, mais pour l’instant nous n’avons rien observé de tel.

Dans votre étude, vous ne vous êtes pas seulement intéressé aux mutations du virus, mais aussi aux zones stables de son génome. Pourquoi?

Certaines régions du génome du SARS-CoV-2 se transforment en effet peu dans le temps; on dit qu’elles sont contraintes. Connaître ces zones est important car elles peuvent avoir un potentiel pour le développement des médicaments ou des vaccins. Il y a actuellement plus de 100 vaccins à l’étude à travers le monde. Pour être efficace sur le long terme, le vaccin devra cibler un antigène (zone du virus reconnu par un anticorps) qui ne se transforme pas au cours du temps. Ces zones stables du génome peuvent donc susciter l’intérêt d’autres chercheurs. C’est pourquoi nous avons créé un site internet pour partager ces informations.

Lire aussi: Covid-19: à quand un vaccin?