«Tant qu’il y aura des humains sur Terre, il y aura quelqu’un pour lire de l’ADN.» Pour Christophe Dessimoz, un chercheur suisse de l’EPFZ installé temporairement à l’European Bioinformatics Institute (EBI), en Grande-Bretagne, notre curiosité est la meilleure justification des efforts entrepris pour stocker des informations sous forme de brins d’ADN. Il cosigne aujourd’hui des travaux publiés dans la revue Nature, qui confirment que la molécule du vivant pourrait devenir le Graal de l’archivage d’informations à long terme.

Pour les historiens, il est plus facile d’étudier les archives de la guerre de Sécession que celles du conflit au Vietnam, survenu un siècle plus tard. Parce qu’à l’époque d’Abraham Lincoln, tout était consigné sur du papier, tandis que les lecteurs de bandes magnétiques des «seventies» ont disparu. Depuis l’invention de l’informatique, la quantité d’informations créée par l’humanité a crû de manière exponentielle, sans que personne n’ait trouvé le moyen de la préserver durablement.

D’où l’idée de mimer la nature en fabriquant un ADN de synthèse à des fins d’archivage. Car c’est une molécule étonnamment stable: nous pouvons décoder l’ADN de nos ancêtres Néandertaliens, tout comme celui de mammouths enfouis dans les glaces sibériennes. Stocké dans de bonnes conditions, à l’abri de l’humidité et de la lumière, l’ADN serait donc susceptible de résister de résister des dizaines de milliers d’années.

Dans les ordinateurs, les informations sont mémorisées sous la forme d’une suite de 0 et de 1. L’ADN s’appuie sur un alphabet de quatre lettres, les quatre molécules élémentaires du génome: A pour adénine, C pour cytosine, G pour guanine et T pour thymine. Des molécules qu’on peut assembler une à une, pour créer de l’ADN artificiel, et ensuite décoder à volonté.

En août dernier, une équipe de George Church, à l’Université de Harvard, avait proposé une méthode d’archivage par ADN dans la revue Science. Les travaux du groupe de Nick Goldman à l’EBI ont été réalisés à la même époque, début 2012, même s’ils ne sont publiés qu’aujourd’hui par Nature. L’équipe a défini une méthode pour traduire les 0 et 1 en A, C, T et G, avant de synthétiser des fragments d’ADN correspondant à cinq fichiers: les sonnets de Shakespeare, un extrait sonore d’un discours de Martin Luther King, une photo, une copie de l’article de 1953 décrivant la structure de l’ADN, ainsi que du code informatique. Au total, 739 kilooctets de données, représentées par 115 000 petits brins d’ADN dupliqués à 12 millions d’exemplaires, avant d’être lyophilisés pour une meilleure conservation. Le tout tient dans une petite éprouvette, avec une densité de stockage de 2200 téraoctets par gramme. L’équivalent de mille gros disques durs informatiques dans un gramme de matière!

«L’équipe de George Church avait obtenu une densité d’information beaucoup plus élevée, analyse Jérôme Bonnet, bio-ingénieur à l’Université de Stanford (Californie). Mais sa technique de codage était moins sophistiquée et sujette à des erreurs de lecture.» L’équipe britannique a presque obtenu un sans-faute. «Notre codage est encore rudimentaire, bien plus que ce qui se fait pour éviter les erreurs de lecture dans les CD, souligne Christophe Dessimoz. Il faut voir cette expérience comme une preuve de concept.» Un avis partagé par Sriram Kosuri, qui travaille avec George Church aux Etats-Unis. «Nos techniques sont là pour démontrer que le stockage d’informations sous forme d’ADN présente un grand intérêt.»

Pas question, bien sûr, de remplacer les disques durs informatiques par des éprouvettes. Car les opérations de synthèse et de lecture d’ADN se mesurent en longues minutes ou en heures, des durées incompatibles avec un accès fréquent. «Cette idée s’applique seulement à l’archivage à long terme de données auxquelles on n’accède pas souvent. Par exemple, pour stocker des photos qui ne seront regardées que dans trois générations, par vos arrière-petits-enfants», précise Christophe Dessimoz.

Son groupe a tenté d’évaluer ce que coûterait cette méthode de stockage: environ 10 000 euros par mégaoctet créé. «Comme le coût de conservation de l’ADN est quasi nul, la méthode est déjà compétitive pour des applications très pointues. Par exemple, pour conserver à très long terme les coordonnées de sites nucléaires. D’ici 10 ans, le prix sera divisé par 100, au moins, ce qui permettra vraiment de développer l’archivage par ADN.»

Aux Etats-Unis, l’équipe de George Church a déjà noué des contacts avec des industriels. En Europe, à l’EBI, la recherche reste avant tout académique, même si un brevet a été déposé. «Nous avons numérisé l’équivalent d’un livre, indique Christophe Dessimoz. Nous allons tenter l’expérience à l’échelle d’une bibliothèque. Vous imaginez si l’on pouvait préserver les trésors de la Bibliothèque d’Alexandrie pour les 10 000 prochaines années?»

«D’ici à dix ans, le prix sera divisé par cent, ce qui permettra vraiment de développer l’archivage par ADN»

L’équivalent de 1000 gros disques durs informatiques tient dans un grammede matière