Une intelligence artificielle écrabouille les meilleurs joueurs humains à StarCraft.

«Je n’ai jamais vu une partie comme ça.»
Le joueur Grzegorz «MaNa» Komincz a sauvé l’honneur des humains à l’occasion d’une partie de «StarCraft 2» diffusée en direct sur le Net. Il a maté AlphaStar, le programme d’intelligence artificielle qui avait enchaîné une série de 10 victoires contre lui et l’Allemand Dario «TLO» Wünsch, autre joueur professionnel du jeu de stratégie en temps réel.

Publié le 28 Janvier 2019
Image principale : ©DR

Durant cette manche, les commentateurs ont relevé qu’AlphaStar avait fait preuve de moins d’audace que lors de ses sorties précédentes où il avait impressionné par la variété de ses plans de jeu.

Mais pour cette partie d’exhibition, l’algorithme avait subi quelques modifications. Son taux d'actions par minute avait été bridé pour rendre le match plus équitable. Pour que l’humain, aussi brillant soit-il, ait une chance de gagner.

L’entraînement d’Alphastar chez Deepmind ©Deepmind

Pour «MaNa», cette série de parties a été riche d’enseignements. «J’ai réalisé à quel point mon gameplay reposait sur les erreurs faites par l’adversaire et l’exploitation des réactions humaines. Cela a placé le jeu sous un tout autre éclairage pour moi», a commenté le joueur professionnel polonais.

«J'ai été impressionné de voir AlphaStar sortir des techniques et des stratégies différentes au fil de chaque partie, il ne joue absolument pas comme un humain, il est imprévisible.»

A réagi le Polonais, soufflé et dépassé, notamment, par la microgestion de son «adversaire» aux capacités surhumaines.

AlphaStar est ainsi le nouveau champion de DeepMind à peine deux ans après son arrivée dans l’univers de «StarCraft 2».

DeepMind StarCraft II Demonstration ©DeepMind

Deepmind, la filiale de Google qui a créé et formé Alphastar, avait déjà été à l’origine d’AlphaGo, qui avait marqué les esprits en 2017 battant le No1 mondial du jeu de go.

Pour que les intelligences artificielles arrivent à de telles performances, les chercheurs de DeepMind se sont appuyés sur une méthode d’apprentissage par renforcement. Le principe consiste à ce que les IA testent le jeu et essayent dans un premier temps de rester en vie. Après cela, ils améliorent leurs performances en copiant celles des humains.

La conclusion est que AlphaStar n'a pas gagné car elle était plus rapide : les chiffres montrent que le temps de réaction de l'IA est inférieur à celui des joueurs pro. AlphaStar a gagné car elle prenait de meilleures décisions, utilisait des meilleures stratégies et était plus efficace en terme de micro-management.

StarCraft est un des jeux de stratégie les plus compliqués à jouer. ©Blizzard

La finalité des recherches effectuées par DeepMind n’est pas de concevoir des intelligences artificielles capables de battre les humains aux jeux vidéo. Dixit Oriol Vinyals, codirecteur du projet AlphaStar :

«Nous voulons créer une IA générale pouvant fonctionner dans des environnements virtuels complexes.»

On n’est plus très loin des ROBOTS d’Isaac Asimov !

DeepMind StarCraft II Demonstration