En marge de The International 8, le plus grand tournoi e-sport jamais organisé, OpenAI, l’intelligence artificielle d’Elon Musk, s’est frottée à des joueurs professionnels. Cette confrontation entre la machine et l’humanité a tourné à l’avantage du genre humain… pour le moment.

L'humanité s'offre un sursis grâce aux joueurs

Nous sommes en 1996, DeeBlue affronte Kasparaov, au cours d’une partie d’échecs qui restera gravée dans l’histoire de l’humanité. La machine terrasse l’homme dans l’une de ses disciplines les plus intellectuelles. Vingt ans plus tard, l’algorithme, qui se fait appeler Deepmind depuis son rachat par Google, franchit une nouvelle étape en venant à bout de Lee Sedol, considéré comme le meilleur joueur de Go de sa génération. L’année suivante, c’est au tour du champion du monde Ke Jie de s’avouer vaincu. À la surprise générale, Deepmind AlphaGo prend sa retraite à l’issue de cette confrontation. Ses développeurs veulent se concentrer sur une discipline qu’ils jugent encore plus complexe… le jeu vidéo compétitif et, en l’occurrence, Starcraft 2. OpenAI, l’algorithme de la fondation éponyme créée par Elon Musk et dotée d’un milliard de dollars de financements, est passée directement à cette étape en se concentrant sur Dota 2, un jeu de stratégie où s’affrontent deux équipes de cinq joueurs dans le but d’aller détruire la base de son adversaire. Un choix qui peut paraître étonnant à première vue : il semble plus sérieux de vaincre l’Homme sur un échiquier ou sur un plateau de Go qu’en lui envoyant une armée d’orques, de centaures ou de sorciers. Mais c’est loin d’être le cas. Un joueur d’échecs a, en moyenne, 35 coups possibles à chacun de ses tours ; un joueur de Go en a 250. Les développeurs d’OpenAI estiment que chacun des bots de son équipe – cinq, donc – doit trancher, tous les huitièmes de seconde, entre environ 1 000 actions valides. Sachant qu’un match de Dota 2 dure généralement 45 minutes, on mesure mieux l’ampleur de la tâche ! Pire, la grande majorité des mouvements de l’adversaire ne sont pas visibles, rendant l’anticipation encore plus complexe. C’est en raison de cette complexité que les intelligences artificielles actuelles font leurs armes sur les jeux de stratégie avant de s’attaquer à des domaines plus élaborés. Il y a un mois, OpenAI 5, les cinq robots dédiés à Dota 2, faisait sensation en battant une équipe de semi-professionnels composée de la crème des spécialistes, les cinq joueurs faisant partie du top 1% au classement du jeu de Valve. Lors de The International 9, le plus grand tournoi d’e-sport jamais organisé qui vient de s’achever, l’humanité avait ainsi l’occasion de réagir au cours des trois matchs d’exhibition.

Terminator attendra

Les confrontations entre la machine et les humains tournèrent toutes en faveur de ces derniers et montrèrent les limites actuelles de l’intelligence artificielle. Deepmind et Open AI “apprennent” à travers un processus baptisé apprentissage par renforcement ou reinforcement learning. Plus concrètement, l’algorithme n’analyse pas des milliers de parties jouées par des humains, mais part d’une page entièrement blanche. Chacune de ses actions est jugée à l’aune de ses résultats et les meilleures, dans une situation donnée, sont retenues dans une “mémoire” ou l’AI viendra piocher dans des situations analogues. C’est un mécanisme très proche du nôtre et de celui des animaux. Pour remplir cette “mémoire”, qui équivaut à de l’expérience, OpenAI affronte des clones de lui-même à travers des milliards de parties. Chaque jour, l’algorithme joue l’équivalent de 180 ans de Dota 2 ! Cette méthode particulièrement lente devient efficiente au fur et à mesure que la puissance de calcul augmente et s’avère redoutablement efficace sur le long terme. Les escarmouches qui émaillèrent les parties contre les professionnels ont montré que l’AI était déjà supérieure aux hommes lorsqu’il s’agissait de mener des attaques rapides et coordonnées, mais qu’elle pêche encore dans la macrostratégie. À l’heure actuelle son champ de prédiction ne dépasse pas 14 minutes, ce qui est encore assez limité. Les chercheurs travaillent déjà sur des versions capables de développer une stratégie à plus long terme. L’humanité est sauve, mais pour combien de temps encore ?

Auteur dr4z
Publié le
Catégories Actualité Gaming
vues 6430

Commentaires

Laisser un commentaire

Aucun commentaire ;(