Abonnez-vous pour des conseils quotidiens, des idées inspirantes et des offres exclusives directement dans votre boîte mail.

Google Gemini Robotics marque une avancée significative en intégrant l’intelligence artificielle générative dans la robotique. Améliorant les capacités de ses prédécesseurs, il permet aux robots de s’adapter à des situations inédites, d’interagir avec des instructions variées et de réaliser des tâches complexes sans entraînement préalable. En collaboration avec Apptroniks, Google vise à optimiser le raisonnement spatial des robots, promettant une utilisation future dans divers environnements, bien que leur déploiement domestique reste encore à attendre.

Google Gemini Robotics : Une Révolution dans le Monde Physique

Google Gemini excelle dans diverses tâches numériques, comme la création de textes et d’images. Cependant, son dernier modèle, Google Robotics, représente une avancée majeure en intégrant l’intelligence artificielle générative dans le monde réel. Ce développement pourrait accélérer de manière significative l’essor des robots humanoïdes.

Améliorations Clés de Gemini Robotics

Dévoilé par DeepMind de Google, Gemini Robotics améliore les capacités de son prédécesseur dans trois domaines essentiels. Ces améliorations ont un impact considérable sur l’efficacité des robots, tant dans des environnements de travail que dans des situations inconnues.

La généralisation permet aux robots d’utiliser la vaste connaissance de Gemini sur le monde pour s’adapter à de nouvelles situations et accomplir des tâches inédites. Dans une démonstration, des chercheurs ont montré un robot équipé de bras capables de jouer au basketball, lui demandant de réaliser un dunk. Bien qu’il n’ait jamais rencontré ce jeu auparavant, le robot a réussi à marquer en plaçant la balle orange dans le panier en plastique.

En outre, Gemini Robotics rend les robots plus interactifs, capables de répondre à des instructions verbales variées et à des conditions imprévues. Dans un autre exemple, un robot a été chargé de mettre des raisins dans un bol, mais le bol a été déplacé pendant l’exécution de la tâche. Malgré cela, le robot a su ajuster ses mouvements et réussir à accomplir la tâche.

Les capacités agiles de Gemini Robotics permettent également aux robots de réaliser des tâches telles que jouer au morpion, effacer un tableau blanc ou plier du papier en origami, tout en répondant à des instructions en langage naturel sans nécessiter d’entraînement préalable. C’est un spectacle impressionnant.

Bien que l’intégration de l’IA dans la robotique ne soit pas une nouveauté, l’année précédente, OpenAI avait collaboré avec Figure AI pour créer un robot humanoïde capable de suivre des instructions verbales. Tout comme Gemini Robotics, le modèle de langage visuel de Figure 01 permet des interactions fluides et adaptatives avec son environnement.

Durant une démonstration, un robot humanoïde a été interrogé sur ce qu’il voyait parmi divers objets. Après avoir énuméré ces derniers, il a été redirigé vers une nouvelle tâche, à savoir apporter quelque chose à manger. Le robot a alors saisi une pomme et l’a tendue sans aucune hésitation.

Bien que les démonstrations de Google se soient principalement concentrées sur les bras et les mains des robots, des ambitions plus vastes sont en cours. Google collabore avec Apptroniks pour intégrer ce modèle dans son robot humanoïde Apollo. En ajoutant un modèle de langage visuel avancé appelé Gemini Robotics-ER, Google vise à améliorer le raisonnement spatial en robotique.

Gemini Robotics-ER devrait optimiser le raisonnement en temps réel, permettant aux robots de comprendre rapidement comment manipuler des objets inconnus. Google décrit cette solution comme complète, affirmant qu’elle pourra gérer toutes les étapes nécessaires pour contrôler un robot dès son déballage, y compris la perception, l’estimation d’état, la compréhension spatiale, la planification et la génération de code.

Ce modèle sera mis à disposition de plusieurs entreprises spécialisées dans la robotique, telles que Boston Dynamics, Agile Robots et Agility Robots. En somme, Gemini Robotics représente une avancée prometteuse pour les développeurs de robots humanoïdes. Cependant, comme beaucoup de ces robots sont conçus pour des environnements industriels ou encore en phase de développement, il est probable qu’il faille attendre un certain temps avant de voir des robots équipés de cette technologie dans nos foyers.