Gemini, l IA de Google, est en train de battre Pokémon Red! 6 badges déjà gagnés, même si elle utilise une mini-carte et des outils de navigation. Fascinant de voir les progrès (et limites) des IA dans les jeux vidéo. Prochaine étape: la Ligue Pokémon! #IA #Gaming

Article en référence: https://i.redd.it/el8xiep3wowe1.jpeg

Récapitulatif factuel

Gemini, le modèle d’intelligence artificielle de Google, est en train de réaliser un exploit remarquable : battre le jeu Pokémon Red. Selon les informations partagées sur Reddit, Gemini a déjà vaincu six des huit champions d’arènes du jeu. Cette performance est particulièrement intéressante car elle démontre les capacités d’un grand modèle de langage (LLM) à interagir avec un environnement de jeu vidéo.

Pour comprendre l’importance de cet exploit, il faut savoir que Pokémon Red est un jeu de rôle sorti en 1996 qui demande aux joueurs de naviguer dans un monde ouvert, de combattre stratégiquement et de résoudre des énigmes. Le défi pour une IA est considérable car elle doit comprendre l’espace de jeu, planifier ses déplacements et prendre des décisions tactiques.

Cependant, il est important de noter que Gemini bénéficie d’outils d’assistance spécifiques pour l’aider dans sa tâche. Notamment, l’IA utilise une mini-carte pour l’aider à se repérer dans l’espace de jeu et un outil de recherche de chemin (pathfinding) pour faciliter ses déplacements. Ces aides compensent certaines limitations actuelles des modèles de langage en matière de représentation spatiale.

Le stream est diffusé en direct sur Twitch, permettant aux spectateurs de suivre les progrès de l’IA en temps réel. Cette expérience s’inscrit dans une tendance plus large d’utilisation des jeux vidéo comme bancs d’essai pour évaluer les capacités des intelligences artificielles, notamment leur raisonnement spatial, leur planification et leur prise de décision.

Point de vue neutre

Cette expérience avec Gemini jouant à Pokémon représente un équilibre intéressant entre prouesse technologique et limitations pratiques. D’un côté, voir un modèle de langage naviguer dans un jeu vidéo et progresser de manière significative est impressionnant. De l’autre, les assistances fournies (mini-carte, pathfinding) révèlent les limites actuelles de ces systèmes.

Ce qui se joue ici va au-delà d’une simple partie de Pokémon. C’est une démonstration concrète de l’état actuel de l’IA générative : capable de performances remarquables dans certains domaines, mais nécessitant encore des “béquilles” pour compenser ses faiblesses. Les LLMs excellent dans le traitement du langage et le raisonnement abstrait, mais peinent encore avec la représentation spatiale et la mémoire à long terme.

La comparaison avec Claude, un autre modèle d’IA qui tente également de battre Pokémon mais sans mini-carte, est particulièrement révélatrice. Ces différences d’approche nous permettent de mieux comprendre les forces et faiblesses respectives des modèles, au-delà des benchmarks traditionnels qui ne capturent pas toujours les nuances de leurs capacités.

En fin de compte, cette expérience nous offre une fenêtre sur l’évolution des IA : elles progressent rapidement, mais par étapes, avec des assistances qui diminuent progressivement. C’est moins une question de “triche” qu’une illustration du processus d’apprentissage et d’adaptation de ces systèmes à des tâches de plus en plus complexes.

Exemple

Imaginez que vous confiez à votre neveu de 5 ans la tâche de faire une recette de gâteau. Bien sûr, vous ne le laissez pas seul face au four préchauffé à 180°C avec un sac de farine et des œufs! Vous lui fournissez une recette illustrée, vous lui montrez où sont les ingrédients, et vous l’aidez à mesurer les quantités.

Gemini qui joue à Pokémon, c’est un peu comme ça. Notre “neveu IA” est impressionnant : il comprend les règles du jeu, reconnaît les Pokémon, et sait qu’il faut battre les champions d’arène. Mais il a besoin de sa “mini-carte” (comme les images sur la recette) et de son “pathfinder” (comme vous qui lui montrez où est la farine dans le placard).

Quand votre neveu réussit son gâteau, vous êtes fier, même si vous l’avez aidé. Et quand il grandira, il aura besoin de moins en moins d’aide. Un jour, il pourra peut-être inventer ses propres recettes!

De même, voir Gemini battre six champions d’arène est impressionnant, même avec ses “petites roues d’apprentissage”. Et comme pour votre neveu, l’objectif n’est pas de juger si c’est de la “triche”, mais de célébrer les progrès tout en reconnaissant le chemin qu’il reste à parcourir avant que l’IA puisse cuisiner son propre gâteau… euh, je veux dire, jouer à Pokémon sans aide!

Point de vue optimiste

Ce que nous voyons avec Gemini jouant à Pokémon est rien de moins qu’une révolution en marche! Pensez-y: une IA qui maîtrise un jeu vidéo complexe, prend des décisions stratégiques et progresse vers un objectif à long terme. C’est exactement le genre de capacités dont nous avons besoin pour des assistants IA véritablement utiles dans notre quotidien.

Les critiques qui pointent l’utilisation d’une mini-carte comme une “triche” manquent l’essentiel. Ces outils ne sont que des échafaudages temporaires qui nous permettent de tester et d’améliorer les capacités fondamentales de l’IA. C’est comme apprendre à un enfant à faire du vélo avec des roues d’apprentissage – elles disparaîtront avec le temps!

Cette expérience ouvre la voie à des applications fascinantes. Imaginez des assistants IA capables de vous aider à naviguer dans des interfaces complexes, à résoudre des problèmes en temps réel, ou même à vous coacher dans vos jeux préférés. La capacité de Gemini à maintenir sa cohérence sur un contexte d’un million de tokens est particulièrement prometteuse – c’est comme avoir une mémoire de travail exceptionnelle.

Dans quelques années, nous regarderons en arrière et verrons cette partie de Pokémon comme un moment charnière, où les IA ont commencé à démontrer une véritable agilité cognitive. Les prochaines générations de modèles n’auront probablement plus besoin de ces assistances, et nous verrons des IA capables de maîtriser des environnements bien plus complexes, ouvrant la voie à une nouvelle ère d’assistants intelligents qui comprennent véritablement notre monde.

Point de vue pessimiste

Cette démonstration de Gemini jouant à Pokémon illustre parfaitement le problème des IA actuelles: beaucoup de spectacle pour masquer des limitations fondamentales. On nous présente une IA “battant” un jeu, mais avec des béquilles significatives – mini-carte, pathfinding, et autres assistances techniques – qui contournent précisément les défis cognitifs que l’IA devrait résoudre.

Ce qui est troublant, c’est la façon dont ces expériences sont présentées au public. On parle d’une IA “battant” Pokémon, créant l’illusion d’une intelligence comparable à celle d’un humain, alors qu’en réalité, nous avons un système qui ne peut même pas se souvenir de l’agencement des pièces qu’il a visitées sans aide externe. C’est comme vanter les mérites d’un “nageur” qui utilise des flotteurs.

Le coût de cette expérience est également révélateur: plus de 60 000$ selon certaines estimations, pour faire ce qu’un enfant de 10 ans accomplit sans effort. Cette disproportion entre ressources investies et capacités réelles devrait nous faire réfléchir sur l’efficacité de notre approche actuelle de l’IA.

Plus inquiétant encore est l’engouement que suscitent ces démonstrations superficielles. Pendant que nous nous émerveillons devant une IA jouant à un jeu de 1996 avec assistance, nous détournons l’attention et les ressources des problèmes fondamentaux non résolus: la compréhension causale, le raisonnement spatial autonome, et la véritable intelligence adaptative. Ces modèles restent des systèmes statistiques sophistiqués, et non des entités véritablement intelligentes – une distinction que ces spectacles médiatiques tendent à obscurcir dangereusement.

Redirection en cours...

Si vous n'êtes pas redirigé automatiquement, 👉 cliquez ici 👈