Une machine nous a écrasés chez Pokémon


Pendant un bref instant, nous avons pu goûter à la victoire. Au premier tour de notre bataille Pokémon en ligne contre le joueur Athena2023, notre Aegislash a infligé de sérieux dégâts à Gengar d’Athena2023. Un coup de plus comme ça, et Gengar, un petit fantôme violet avec un sourire sinistre, serait grillé.

Mais Athena2023 avait d’autres idées. Avant que nous puissions faire un autre mouvement, Gengar a fait exploser Aegislash, un Pokémon en lévitation avec l’apparence d’une épée et d’un bouclier zoomorphes, avec une seule attaque. Le but d’une bataille est d’utiliser votre équipe de six Pokémon pour assommer les six de votre adversaire, et nous perdions rapidement. Athena2023 a envoyé un Lunala, un oiseau démoniaque violet et blanc avec des faux pour les ailes, qui a éviscéré trois Pokémon consécutifs lors d’une attaque appelée Moongeist Beam. Au tour 13, nous avions perdu quatre de nos Pokémon et vaincu exactement zéro d’Athena2023.

Une telle démonstration pathétique pourrait normalement susciter un sourire narquois ou une certaine pitié de la part d’un joueur adverse. Mais Athena2023 n’est pas capable de sourire narquoisement ou d’étendre la pitié – ou de quoi que ce soit d’autre que de jouer à Pokémon, d’ailleurs – car il s’agit d’une IA conçue par l’informaticien Nicholas Sarantinos. Il s’est avéré que nous n’avions pas non plus beaucoup à avoir honte : Athena2023 s’était à un moment donné classé 33e au monde sur le simulateur de combat en ligne Pokémon Showdown.

Apprendre à une IA à jouer à Pokémon est assez impressionnant et peut-être un peu frivole. Mais Sarantinos envisageait son programme comme plus qu’un moyen de détruire des joueurs médiocres comme nous. Dans son article, qui n’a pas encore été évalué par des pairs, il écrit qu’il pourrait « inspirer toutes sortes d’applications qui nécessitent une gestion d’équipe dans des conditions d’extrême incertitude », comme une équipe de médecins dans « une région frappée par une pandémie ou une guerre ». -zone. » Cela semble être un bond en avant, mais le jeu a fourni pendant des décennies un moyen d’expérimenter l’IA qui n’était pas encore prête pour le monde réel. Qu’est-ce, après tout, que la vie sinon le jeu le plus compliqué de tous ?

Dans un sens, la chose la plus surprenante à propos des IA Pokémon n’est pas qu’elles existent mais qu’elles n’existaient pas plus tôt. Dans les années 1950, certaines des premières IA rudimentaires étaient des programmes de jeu d’échecs et de dames. L’idée était simple, Julian Togelius, un informaticien de la NYU qui a beaucoup écrit sur l’IA et les jeux, nous a dit : « Nous voulons créer l’intelligence artificielle, alors faisons ce que font les gens intelligents.” En 1997, le supercalculateur Deep Blue d’IBM a vaincu le champion du monde d’échecs Garry Kasparov, et une décennie plus tard, les dames ont été entièrement « résolues ». Au cours des dernières années, les chercheurs en intelligence artificielle se sont diversifiés vers une variété de jeux beaucoup plus large. Leurs machines ont joué au poker, Pac-Man et Super Mario Bros. La poursuite n’est pas marginale : ces derniers mois seulement, les géants de l’IA Meta et Deepmind ont publié de nouveaux travaux sur Stratego, Diplomacy et Minecraft.

Maîtriser l’un de ces éléments est un défi, mais le fait que cela soit possible fait des jeux une cible attrayante pour les programmeurs. « Les jeux ont été le principal banc d’essai des enquêtes sur l’IA », déclare Georgios Yannakakis, directeur de l’Institut des jeux numériques de l’Université de Malte. Ils sont contrôlables d’une manière que la vraie vie ne l’est pas : une partie d’échecs se déroule sur 64 cases, utilise six types de pièces qui n’effectuent que certains mouvements et se termine toujours par une victoire, un match nul ou une défaite. Les jeux plus complexes, qu’ils aient un grand monde en trois dimensions comme Minecraft ou des informations cachées comme le poker, ont toujours des règles et des résultats. Même une route virtuelle conçue pour entraîner l’IA à la conduite est, en ce sens, un jeu.

Dans les jeux et les simulations, les chercheurs peuvent accéder à d’énormes quantités de données, casser des choses gratuitement et déterminer facilement le succès de leur logiciel. Une fois développé dans un jeu, un algorithme peut être applicable ailleurs – la recherche sur les échecs et le jeu de stratégie chinois Go a avancé de nombreux algorithmes d’IA de pointe ; des environnements de jeu simulés aident l’IA à naviguer dans l’espace 3D ; le poker a amélioré la capacité des ordinateurs à raisonner avec des informations imparfaites.

Mais les raisons mêmes pour lesquelles les jeux sont des bancs d’essai attrayants sont précisément la raison pour laquelle ils peuvent entraver Recherche : Des environnements contrôlés, des repères clairs et des règles établies, même dans des jeux complexes et tridimensionnels, sont « à certains égards des idéalisations de la vie réelle », explique Melanie Mitchell, qui étudie l’intelligence naturelle et artificielle au Santa Fe Institute. Les compétences nécessaires pour gagner un jeu ne se transfèrent pas facilement ou peuvent même masquer les défis qui se présentent dans le monde réel beaucoup plus complexe. Un humain qui jouait exclusivement aux échecs ne pourrait pas faire grand-chose d’autre ; ce n’est pas ainsi que vivent la plupart des gens, mais c’est précisément ainsi que fonctionnent les ordinateurs. En effet, des décennies de travail sur des programmes de jeu d’échecs, bien que fructueux, ont également orienté la recherche sur l’IA vers des techniques de jeu spécifiques au détriment d’autres approches du monde réel.

Mais une application claire dans le monde réel pourrait être une préoccupation secondaire pour certains programmeurs – un ordinateur écrasant les humains à n’importe quel jeu fait une presse fantastique. « Vous avez un grand nombre de chercheurs et de financements de recherche vraiment concentrés sur la réalisation de très belles démos », déclare Deborah Raji, chercheuse en IA et membre de Mozilla, « et ne produisant pas vraiment de progrès significatifs sur les problèmes du monde réel ». Les voitures autonomes, après des essais continus, s’écrasent constamment. Même les modèles de langage tels que celui qui sous-tend ChatGPT, avec un accent particulier sur le « jeu » de la prédiction de texte, s’avèrent terribles dans d’autres domaines.

Ou peut-être que s’attendre à ce qu’un algorithme se transfère de manière transparente d’un jeu à un monde est en soi une simplification de la découverte – une grande partie de la recherche non seulement en informatique, mais aussi en théorie des nombres, en biologie et dans n’importe quel domaine reste en sommeil avant de refaire surface de manière inattendue. La pénicilline et le Coca-Cola étaient des accidents ; après avoir frustré les mathématiciens pendant trois siècles, le dernier théorème de Fermat a été résolu en prouvant une conjecture apparemment sans rapport. « Dans deux, trois ans, il y aura peut-être quelqu’un qui prendra l’algorithme [from a game] et l’applique à quelque chose de complètement différent, et nous avons une percée », a déclaré Yannakakis.

L’IA de jeu récente la plus impressionnante est sans doute Cicero, conçue l’année dernière par une équipe de chercheurs de Meta pour jouer à Diplomacy, un jeu de plateau stratégique qui ressemble un peu au risque européen de la Première Guerre mondiale, mais sans les éléments de hasard. et avec beaucoup plus de négociation, de coopération et de manœuvres interpersonnelles. Comme ChatGPT, Cicero s’appuie sur un modèle de langage pour communiquer avec ses adversaires humains, mais contrairement à ChatGPT, il doit relier ces mots à des actions. Il doit avoir une théorie de l’esprit. « Nous essayions en fait de réfléchir à ce qui serait le jeu le plus difficile pour lequel créer une IA », nous a dit Noam Brown, l’un des chercheurs de Meta qui a conçu Cicero.

Mais un défi encore plus difficile pourrait être de concevoir des IA capables de jouer plusieurs Jeux. Certains d’entre eux existent déjà : MuZero de Deepmind maîtrise les échecs, le go, le shogi (également connu sous le nom d’échecs japonais) et 57 jeux Atari différents. Plus le nombre et la diversité de l’ensemble des jeux sont grands, plus il est difficile de concevoir une seule IA capable de tous les jouer. « Si nous avions un logiciel capable de prendre n’importe quel jeu de la liste des 200 meilleurs sur l’App Store… et d’y jouer aussi bien qu’un bon humain, aurions-nous des jeux artificiels ? [general] intelligence? Nous aurions quelque chose comme ça », a déclaré Togelius. Additionnez tous les jeux et vous obtenez finalement quelque chose comme la vie.

Ce potentiel est ce qui a attiré Sarantinos vers Pokémon : le jeu semblait présenter un certain nombre de défis intéressants, avec ses règles compliquées, ses informations incomplètes et sa pure stochasticité, sans parler du nombre époustouflant de façons possibles dont une bataille peut se dérouler. Le lien entre la gestion de six Pokémon numériques dans une bataille en ligne et la gestion de six médecins humains dans une véritable zone de guerre semble, il faut le dire, plutôt ténu. Mais le véritable espoir de Sarantinos, a-t-il dit, est que son travail servira de référence par rapport à laquelle de futures IA plus avancées pourront être testées.

Si ces agents plus avancés sont des joueurs Pokémon encore plus forts qu’Athena2023, alors nous ne voulons rien avoir à faire avec eux. Au moment où nous avons finalement réussi à vaincre l’un des six Pokémon d’Athéna, il ne restait plus qu’un des nôtres : Hitmonlee, un Pokémon kickboxeur sans cou sans bouche, nez ou oreilles apparents. Lunala est revenue, l’effrayant hybride oiseau-faux qui avait si sommairement envoyé la moitié de notre équipe. Les capacités particulières de Lunala le rendent entièrement insensible à toutes les attaques d’Hitmonlee, de sorte qu’Athena2023 aurait pu achever Hitmonlee – et la bataille – d’un seul coup. Et pourtant, ce n’était pas le cas.

Au lieu de cela, étrangement, il a utilisé un mouvement qui ne cause aucun dommage à l’adversaire. Ensuite, il a utilisé le mouvement encore… et encore… et encore et encore et encore. Au seuil de la victoire, Athena2023 a fait le même geste inutile 12 fois consécutives. Si nous n’avions pas mieux su, nous aurions pu penser qu’il se moquait de nous. Mais c’était une pure idiotie, preuve que même si Athena2023 était plus qu’assez intelligent pour gagner son jeu, il n’était toujours pas très intelligent du tout. L’IA n’était pas sans rappeler notre pitoyable Hitmonlee : excellent pour kickboxer des adversaires à mort mais aussi sans cou, sans bouche, sans nez, sans oreilles, sans cervelle.





Source link -30