Génétique

Génome chiffré, génome protégé

Comment conserver le contrôle des informations forcément très personnelles contenues dans son ADN? Parmi les pistes envisagées, la technique de chiffrement des données intéresse chercheurs et entreprises

L’ADN contient de nombreuses informations sur notre passé, présent et futur. Après avoir traversé les millénaires en gardant ses secrets enfouis au cœur de chacune ou presque de nos cellules, il est sur le point de tout révéler grâce aux progrès des recherches en génétique, facilités par l’effondrement des coûts du séquençage du génome humain.

Notre dossier: Santé personnalisée: espoirs et enjeux

Comment garantir à chacun le contrôle des informations contenues dans son génome? La question est plus que jamais d’actualité. On estime que 229 000 personnes dans le monde avaient consenti à faire séquencer leur génome en 2014. Elles pourraient être plus de 1 600 000 cette année. Dans ce contexte, des initiatives voient le jour dans certains pays afin d’organiser la collecte, le stockage, le partage et l’utilisation de ces données sensibles. Dans la Confédération, le Swiss Personalized Health Network doit ainsi se pencher sur ces questions ces quatre prochaines années.

Les établissements de santé pris pour cible

Avec un volume croissant d’informations de santé stockées informatiquement, le risque de vols de données (ou d’accès indiscrets par des compagnies d’assurances ou des employeurs) est bien réel. Preuve en est, les établissements de santé sont la cible fréquente d’attaques informatiques. «Aux Etats-Unis, d’après le site gouvernemental consacré à ce problème, il y aurait chaque semaine plusieurs attaques concernant chacune les données de plus de 500 personnes», relate Jean-Pierre Hubaux, professeur au Laboratoire des communications et applications informatiques de l’EPFL.

Le spécialiste de la protection de la sphère privée planche depuis près de 20 ans sur les techniques de protection des données, par des techniques cryptographiques et statistiques. Objectif: garantir le contrôle de l’accès aux données tout en facilitant leur ouverture et leur partage à des fins médicales. Un difficile équilibre. «On veut souvent une chose et son contraire, les avantages sans les inconvénients, avance-t-il. Par exemple tout le monde veut des autoroutes, mais personne ne les accepte juste à côté de sa maison…»

Avec le chiffrement homomorphique, on peut effectuer des opérations sur les données chiffrées sans les décrypter

Jean-Pierre Hubaux, EPFL

L’une des pistes envisagées par les chercheurs consiste à chiffrer les données génomiques, autrement dit les rendre illisibles pour quiconque ne possédant pas la clé de chiffrement. Jean-Pierre Hubaux étudie en particulier le chiffrement dit homomorphique, une méthode qui diffère du chiffrement habituellement employé pour sécuriser l’internet et les transactions bancaires. Avec le chiffrement classique, «vous ne pouvez rien faire d’une donnée chiffrée, si ce n’est la déchiffrer, explique Jean-Pierre Hubaux. Tandis qu’avec le chiffrement homomorphique, on peut effectuer des opérations sur les données chiffrées sans les décrypter». En conséquence, la technique est tout indiquée pour sous-traiter des calculs à des ordinateurs distants (dans le cloud) et dans lesquels on n’a pas une confiance absolue. «Le serveur distant va pouvoir faire les opérations sans "voir" les données», résume le chercheur.

Volume de données quadruplé

Un des inconvénients d’une telle technique est qu’elle nécessite un grand nombre de calculs et risque donc de mener à des performances insuffisantes. L’équipe de Jean-Pierre Hubaux travaille sur ce sujet, en collaboration avec des généticiens du CHUV. Elle développe par ailleurs des outils statistiques capables d’empêcher de retrouver l’identité d’un patient à partir d’un jeu de données génétiques en principe anonymisé. En 2013, Yaniv Erlich alors au MIT a pu démasquer 50 personnes dont le génome était accessible dans les bases de données en libre accès du 1000 Genomes Project, grâce à des recoupements de données génétiques, généalogiques et d’état civil.

Sans les clés de déchiffrement, le prestataire ne peut rien extraire des données génomiques

Adam Molyneaux, Sophia Genetics

Le secteur privé s’intéresse aussi à la question. Sophia Genetics, société vaudoise spécialisée dans la médecine basée sur les données, a ainsi récemment fait état d’une nouvelle technologie répondant à cette problématique. La compagnie est confrontée à un défi en termes de stockage. «Chaque patient représente un volume de 30 à 200 gigaoctets de données», indique Adam Molyneaux, chief information officer au sein de Sophia Genetics. Chaque année, le volume global de données dans les serveurs sécurisés de l’entreprise est multiplié par quatre, si bien qu’elle doit sans cesse augmenter les capacités de ses serveurs externes.

Nommée SECRAM, leur méthode développée avec l’appui de l’EPFL – Jean-Pierre Hubaux y a participé – et de l’université Stanford offre la garantie que le serveur hébergeant les données de Sophia Genetics ne peut en extraire d’informations. «Sans les clés de déchiffrement, le prestataire ne connaît ni le contenu de la séquence génétique, ni sa position dans le génome, il ne peut donc rien en extraire pour une éventuelle analyse statistique», assure Adam Molyneaux.

Ces solutions demeurent des exemples. «Le chiffrement est une piste intéressante pour garantir l’anonymat», dit Christine Currat, directrice opérationnelle de la Swiss biobanking platform, organisme fédérateur des biobanques helvétiques.

Rassurant, Jean-Pierre Hubaux rappelle que nous ne sommes qu’aux prémices de l’explosion des données de santé. Les biobanques doivent encore procéder au séquençage de leurs échantillons et ne contiennent que très peu de données. «Mais il faut réfléchir dès maintenant aux moyens de les protéger», conclut-il.

Dossier
Santé personnalisée: espoirs et enjeux

Publicité