Analyse

La véritable histoire du Big Data et de son impact

L’histoire de Jeffrey Hammerbacher sert de fil d’Ariane à Steve Lohr, Prix Pulitzer et journaliste d’enquête au New York Times, dans son ouvrage consacré à la révolution du Big Data (1). Jeffrey Hammerbacher, à 32 ans, est une star. Son parcours l’a amené de Harvard à la banque d’investissement (Bear Stearns), puis à la première équipe de scientifiques de données de Facebook et finalement à un hôpital de New York. Ce dévoreur de bouquins, fils d’un syndicaliste de GM, incarne la réussite. Il est riche, fort de trois maisons et d’un compte en banque orné de 10 millions de dollars. Il symbolise surtout la fin du capitalisme financier et l’émergence de l’économie des données. Avec lui, c’est tout le processus de décision, donc le système de penser l’économie, qui se transforme, s’ouvre, s’enrichit.

Le premier scientifique de données est John Tukey, un statisticien (1915-2000) qui aurait fait de la science des données une éthique, celle du «Data First». Plutôt que de partir d’une hypothèse et d’en vérifier la valeur, il aurait montré la nécessité de partir des données et d’en déduire des enseignements.

Erik Brynjolfsson, professeur au MIT, considère le Big Data comme une révolution du management même si elle n’est pas encore perçue par les statistiques. Les décisions prises sur la base des data conduisent à une productivité supérieure de 5 à 6%. Le PIB mondial devrait donc gagner 10 à 15 trillions de dollars en vingt ans. L’équivalent de l’économie chinoise actuelle. L’auteur montre que les talents des scientifiques de données seront recherchés dans tous les domaines. Les mathématiciens n’iront plus en priorité dans les banques. Jeffrey Hammerbacher se dit déçu de l’utilisation stérile des modèles mathématiques dans les équipes de «quants». Ses critiques portent aussi sur Facebook. Les meilleurs esprits scientifiques se limitent à l’analyse de clics révélant les comportements à des fins de marketing, déplore-t-il. C’est pourquoi il a créé l’équipe de scientifiques de données à l’Icahn School of Medicine, au Mount Sinai à New York. Dorénavant il affronte les défis de la biologie plutôt que de la pub.

Dans une salle d’urgence d’un hôpital, 100 décisions sont prises par patient et par jour. Avec Big Data, les données informent sur l’avenir immédiat du patient. Watson, le programme d’intelligence artificielle d’IBM, est capable de scanner et d’analyser 100 000 articles de journaux médicaux en quelques secondes. La médecine entre à l’ère de la décision prédictive. Le saut n’est pas quantitatif mais qualitatif. L’explosion de données sert à l’amélioration de la prise de décision. Et celles-ci interviennent dans tous les domaines.

Jeffrey Hammerbacher se spécialise aujourd’hui sur la troisième cause de décès, les maladies mentales – 46% des Américains en souffrent une fois dans leur vie. Persuadé que la biologie est en retard par rapport à la physique, parce qu’elle est enseignée de façon qualitative et non pas sur la base des données, il œuvre en faveur d’une définition en termes de réseaux (molécules, cellules, organes) et d’interconnexions. C’est pourquoi il insiste pour que les «data scientists» ne soient pas isolés des soins.

A travers ce portrait et celui d’autres stars de la science, Steve Lohr nous montre la profondeur de la révolution en cours. Le Big Data est une vague qui s’impose partout, de l’œnologie à la pub, la santé, ou l’industrie des machines.

Dans les vignobles californiens, on entre dans l’ère du «Big Data Farming», selon l’auteur. A l’aide de senseurs et d’imagerie par satellite, l’eau et les fertilisants sont instillés sur une base individualisée. Après la médecine personnalisée, on entre dans la viticulture personnalisée. C’est le résultat de la coopération entre IBM et E&J Gallo Winery. Le géant informatique s’est ici lié au plus grand exportateur de vins californien. Pour l’instant, les coûts sont quatre fois supérieurs aux méthodes standards, mais l’utilisation à grande échelle de cette technique promet d’énormes gains de productivité. Une autre surprise: la qualité du vin s’améliore et la quantité produite s’accroît.

Dans l’industrie des machines, le géant General Electric s’est pour sa part lancé dans le «contextual computing». L’objectif consiste à réduire le coût d’un parc de machines. Cela s’appelle la maintenance préventive. Les machines tirent progressivement les enseignements de leur état et s’adaptent. La machine intelligente n’est plus très éloignée.

Le défi pour l’emploi n’est pas mince. Pour Erik Brynjolfsson, avec le Big Data ce n’est plus la sueur de l’individu qui est remplacé par les machines, mais ses synapses. On sort d’un monde où l’homme s’est servi de la machine pour entrer dans celui où la machine sera améliorée («augmented») par l’homme. Les effets promettent d’être disruptifs. De ce point de vue, le marché de la pub est un terrain expérimental très intéressant.

Steve Lohr n’ignore pas le risque pour la sphère privée. Le journaliste d’enquête adopte une position «américaine». Pour lui, le risque réside dans l’utilisation plutôt que dans la collection des données. Les Européens ont une vision plus critique. L’auteur n’envisage pas de solution optimale, mais une accommodation, soit une adaptation des comportements autant que des réglementations. Steve Lohr n’est pas dupe. La collecte d’informations est une industrie excessivement opaque. Le plus grand groupe au monde est Acxiom, dans l’Arkansas. Il accumule des milliers d’attributs comportementaux pour des centaines de millions de personnes. Davantage que n’importe quelle agence fédérale ou groupe internet. L’auteur a essayé de connaître les données récoltées sur lui. Il a été fort déçu par leur manque de pertinence et d’exactitude. Ces erreurs sont sources d’énormes dangers, reconnaît-il. Mais la technologie progresse. KnowMe analyse par exemple la personnalité d’un individu sur la base de 200 tweets. Le résultat est très satisfaisant, selon l’auteur. Est-ce que les nouvelles technologies offriront un service au consommateur ou une menace pour sa liberté? Un New Deal a besoin d’être mis sur pied sur les data, déclare-t-il.

(1) Data-ism, Inside the Big Data Revolution, Steve Lohr, Oneworld, 240 pages, 2015

Jeffrey Hammerbacher symbolise la fin du capitalisme financier et l’émergence de l’économie des données