Universités

Un centre suisse pour le Big Data de la science

Les deux écoles polytechniques ont présenté le nouveau Swiss Data Science Center. L’entité doit fédérer informaticiens et chercheurs afin de faire parler les données colossales que ces derniers génèrent lors de leurs expériences

La société se numérise, et avec elle la recherche scientifique. Pour s’atteler à cette révolution, les écoles polytechniques ont officiellement inauguré lundi 6 février le Centre suisse des sciences de données ou Swiss Data Science Center (SDSC). L’entité étant équitablement répartie entre Lausanne et Zurich, c’est en quelque sorte en terrain neutre à Konolfingen en banlieue bernoise qu’a été donné le coup d’envoi autour de quelque 140 chercheurs issus de divers horizons.

Doté de 30 millions de francs sur quatre ans, le SDSC fait partie des grands axes stratégiques identifiés par le conseil des EPF. Son objectif annoncé est de «promouvoir les sciences des données et de l’informatique en Suisse». Il faut comprendre par là que le centre n’a pas vocation à mener ses propres recherches publiées dans des revues, mais vise à offrir une infrastructure et une expertise à des projets variés allant des sciences de l’environnement à la recherche médicale en passant par les sciences humaines.

Lire aussi: «La médecine deviendra une science des données»

Le volet formation est également de la partie, avec la création d’un master dans chaque école dès la rentrée universitaire 2017. «La création du SDSC est un pas important pour la Suisse et constitue une étape indispensable pour avoir plus de compétences liées aux sciences des données dans notre pays», souligne Lino Guzzella, le président de l’EPFZ.

Boîtes noires de données

Des satellites qui quadrillent la planète, des rivières truffées de capteurs, des montres qui mesurent certaines constantes corporelles… Les quantités de données générées chaque jour en recherche ou en industrie donnent le vertige. Un exemple, un «modeste» projet de mesure des flux de carbone dans les cours d’eaux alpins, c’est environ 17 000 données quotidiennes, et plus de 7 millions par an. «Toute la question est désormais de savoir comment on extrait du sens de ces 'boîtes noires' de données», dit Olivier Verscheure, directeur du SDSC.

Lire aussi: «Pour les entreprises, le Big Data est une révolution aussi importante qu’Internet»

C’est là que les choses se compliquent. Les scientifiques sont très forts pour collecter des données et les analyser à moindre échelle, mais un tel Big Data de la science exige des compétences particulières et donc une transdisciplinarité complète. Or «les scientifiques et les spécialistes en analyse de données ne parlent pas le même langage, il faut des intermédiaires capables de jeter des ponts entre ces deux univers», poursuit Olivier Verscheure. Ces intermédiaires fédérateurs, ce sont des «data experts» ou experts des données. Une quarantaine d’entre eux officieront initialement pour le SDSC.

Plateforme dans les nuages

Outre ces ressources humaines, le centre développe actuellement une plateforme d’analyse hébergée dans le cloud. Baptisée «Insight Factory», elle a été brièvement présentée lundi. Les utilisateurs peuvent y rechercher un projet de recherche scientifique, consulter les données récoltées dans le cadre du dit projet, les réutiliser voire ajouter leurs propres jeux de données, qu’ils mettent à disposition de la communauté. De quoi favoriser l’émergence d’une science véritablement ouverte, espère Olivier Verscheure.

Ce retour aux sources d’une science collaborative et transparente a quelque chose de rafraîchissant. A condition bien entendu que les chercheurs jouent le jeu. Sur ce sujet, Olivier Verscheure se montre optimiste. «En science le travail de l’un, c’est le jeu de données des autres», illustre-t-il en précisant que des garde-fous sont prévus, notamment pour les données des entreprises qui collaboreront sur les projets sélectionnés. Cela va de l’anonymisation des données à leur éventuelle dissimulation dans les résultats de recherche, en fonction des impératifs de la propriété intellectuelle.

Défi de société

Le président de l’EPFL Martin Vetterli s’amuse de la remarque: «Les jeunes chercheurs sont beaucoup plus enclins à la science ouverte et transparente que leurs aînés. Il va y avoir un changement générationnel, c’est certain». Et le président de préciser, citant son propre cas de directeur de laboratoire, que les avantages éclipsent les inconvénients. «En interne, travailler sur une plateforme ouverte comme celle-ci fluidifie énormément le processus scientifique», assure-t-il.

Avec le SDSC la Suisse peut-elle espérer rivaliser avec les Etats-Unis ou le Royaume-Uni? «Nous avons ici en Suisse une recherche de qualité, c’est le principal. Ne reste plus qu’à se donner les moyens de promouvoir les sciences des données pour faire jeu égal avec les meilleurs», affirme Olivier Verscheure. Martin Vetterli abonde: «Il ne faut pas lever le pied. Les sciences des données doivent devenir un outil largement utilisé par les entreprises, les laboratoires et dans l’éducation. C’est aussi un défi de société» Le SDSC va lancer au mois de mars un appel à projets: une première série d’une dizaine de collaborations scientifiques seront alors sélectionnées.

Publicité