Fin octobre, les chercheurs de DeepMind, propriété d’Alphabet, la maison mère de Google, ont signé dans la revue Nature un article clamant que leurs machines étaient parvenues à battre des joueurs professionnels du jeu vidéo Starcraft II. Mode de l’intelligence artificielle (IA) oblige, la nouvelle a fait le tour des médias: après les échecs et le jeu de go, un nouveau bastion de l’intelligence humaine venait de s’écrouler. A y regarder de plus près cependant, la performance présente des limites certaines sur lesquelles Google ne s’est pas étendu, mais qui permettent de mieux relativiser cet exploit.

Jeu de stratégie en temps réel développé par Blizzard Entertainment, Starcraft II oppose deux joueurs dans une bataille à la sauce space opera où il faut récolter des ressources pour construire une base militaire et y recruter des unités qui seront envoyées raser les positions ennemies. Chaque partie requiert planification, exploration, bluff, microgestion et surtout adaptation à la stratégie adverse, autrement dit un ensemble de capacités dans lesquelles les humains sont censés surpasser les machines.

Pour beaucoup, concevoir un agent d’IA capable de battre les champions de Starcraft II, qui réunit par ailleurs une scène compétitive de très haut niveau, s’avère autrement plus compliqué que pour le jeu de go: contrairement à ce dernier, on ne voit pas l’adversaire jouer, et le nombre de «coups» possibles dans lesquels pioche le programme est d’un ordre de grandeur bien supérieur.

Des «sparring-partner» pour travailler sur des points précis

Il n’aura pourtant fallu que deux ans à DeepMind pour mener à bien sa tâche. Les auteurs écrivent dans leur article que leur programme AlphaStar Final s’est hissé dans la ligue des Grandmasters, celle réunissant les joueurs représentant les 0,2% du haut du panier.

Lire aussi: Les machines se mesurent au jeu Starcraft II

Trois versions d’AlphaStar (une pour chaque race extraterrestre sélectionnable dans le jeu) ont appris à jouer en regardant des parties, mais surtout en jouant contre elles-mêmes et contre des IA «sparring-partner» programmées non pour gagner, mais pour faire travailler les AlphaStar sur des points précis. Une fois l’entraînement achevé, les IA ont anonymement rejoint Battle.net, la plateforme internet sur laquelle s’affrontent les joueurs. Elles ont alors joué contre des humains sans révéler leur identité, en engrangeant de nombreuses victoires qui leur ont toutes trois fait gravir les échelons du championnat européen, de la ligue de bronze, pour les débutants, jusqu’à son sommet.

L’IA a certes atteint la ligue Grandmaster dans les règles, mais peut-elle réellement s’y maintenir?

Florian Richoux, Université de Nantes

C’est un immense progrès, la ligue Grandmaster étant réservée aux 200 meilleurs joueurs de chaque continent. Surtout, AlphaStar joue à armes égales avec les humains, ce qui n’était pas le cas auparavant. En janvier 2019, lorsque cette IA remportait ses premiers matchs contre des professionnels, elle ne jouait qu’une seule race (et l’imposait à son adversaire), et sur une seule carte. Cette fois, c’est semble-t-il à la régulière que l’IA y est parvenue. Ou presque.

Disponible également: L’IA de Google triomphe à «StarCraft II»… selon ses propres règles

Avantage injuste

Chercheur au Laboratoire des sciences du numérique de l’Université de Nantes et amateur éclairé de Starcraft II, Florian Richoux a analysé les performances de l’IA de Google. «Il s’agit d’un impressionnant résultat scientifique et technique», commente-t-il. Mais qui ne doit pas occulter certaines faiblesses, à commencer par le choix des races de chaque agent. «Ce n’est toujours pas une seule et unique IA capable de jouer les trois races à Starcraft. Par ailleurs, leur système est tel qu’AlphaStar ne semble pas en mesure de jouer Random [mode qui attribue une race au hasard]», tempère le scientifique. Dommage, car cela prouverait que la machine est bel et bien capable de s’adapter à la main qu’elle reçoit. Au lieu de cela, la machine a du mal à trouver de nouvelles stratégies, le système ayant «besoin d’un guidage basé sur des données humaines soigneusement sélectionnées pour y parvenir».

En outre, «rien n’indique qu’AlphaStar est capable d’adapter sa stratégie au cours d’une partie. Il y a fort à parier qu’il fasse la même chose que ce qui avait été remarqué en janvier, à savoir partir bille en tête avec une stratégie et s’y tenir quoi qu’il arrive», poursuit le spécialiste.

Autre critique adressée, AlphaStar conserve quelques privilèges par rapport à ses adversaires. Elle peut ainsi sélectionner individuellement ses unités en dehors de son champ de vision, ou encore jouer en effectuant environ 800 actions par minute (APM), alors qu’un pro avoisine les 400 APM. Avantage injuste? Une partie ne saurait se résumer à «que le plus rapide gagne». Les ingénieurs de Google écrivent d’ailleurs que leurs agents jouent moins bien lorsqu’ils ajustent les APM, à la hausse comme à la baisse. «Cela montre que s’il n’est pas cadré, AlphaStar a du mal à se concentrer sur l’apprentissage de la stratégie plutôt que de passer du temps sur la microgestion [la gestion individuelle des unités lors des combats, situations où priment les APM élevées]», relève Florian Richoux.

Passage en force

Un autre reproche concerne l’approche habituellement privilégiée par les géants de la tech et consistant à mettre à contribution leurs immenses capacités de calcul. «Il a fallu entraîner les IA sur 150 millions de parties, ce qui représente environ 3400 ans de jeu. Grâce à la puissance des supercalculateurs de Google, ce temps a pu être comprimé en 44 jours: je vous laisse imaginer la monstrueuse infrastructure nécessaire pour faire tourner tout cela, sans compter sa consommation électrique…» Un luxe et un passage en force qu’aucun laboratoire académique ne songerait à s’offrir.

Enfin, AlphaStar n’a joué que 30 parties en ligue Grandmaster. «L’agent a certes atteint la ligue Grandmaster dans les règles, mais peut-il réellement s’y maintenir?» s’interroge l’informaticien. La question est pertinente. Car il y a fort à parier que si AlphaStar jouait en dévoilant son identité, les pros auraient tôt fait de s’adapter à cet adversaire qui ne sait pas changer de stratégie au cours d’une partie. Qui sait, cette IA pourrait même conduire les humains à trouver de nouvelles tactiques.

Quant à un hypothétique bénéfice pour la recherche scientifique, Florian Richoux reste sceptique. Tout d’abord parce que Google n’a pas souhaité publier le code source de ses agents, quand bien même la firme a répété qu’elle n'envisageait pas de les commercialiser. Et les débouchés concrets restent flous. «Il n’y a pas d’applications directes, mais cela constitue néanmoins un excellent entraînement pour progresser vers des méthodes exploitables industriellement», conclut-il.

Pour aller plus loin: Jeu vidéo suisse, prouve que tu existes