Eureka : La révolution de l'IA de Nvidia qui enseigne aux robots et surpasse les experts humains

Eureka: La nouvelle IA de Nvidia Research

Nvidia Research, la division de recherche du géant technologique Nvidia, a développé un innovant agent d’intelligence artificielle (IA) baptisé Eureka. Cet agent, propulsé par le modèle GPT-4 d’OpenAI, a la capacité d’enseigner aux robots comment effectuer des tâches complexes de manière autonome. Parmi les compétences qu’il a réussi à inculquer à une main robotique figurent des tours rapides de rotation de stylos, l’ouverture de tiroirs et d’armoires, le lancer et la capture de balles et la manipulation de ciseaux. En tout, Eureka a formé la main robotique à accomplir près de 30 tâches différentes.

Eureka: Une avancée dans le développement d’algorithmes

Mais Eureka ne se contente pas d’enseigner des compétences aux robots. Il est également capable d’écrire des algorithmes de récompense de manière autonome. Cette avancée représente un premier pas vers le développement de nouveaux algorithmes qui intègrent des méthodes génératives et d’apprentissage par renforcement pour résoudre des tâches difficiles.

Pour faciliter l’accès à cette technologie, Nvidia Research a publié la bibliothèque Eureka d’algorithmes d’IA. Les utilisateurs peuvent expérimenter avec ces algorithmes en utilisant Nvidia Isaac Gym, une application de référence pour la simulation physique dans la recherche sur l’apprentissage par renforcement. Isaac Gym est construit sur Nvidia Omniverse, une plateforme conçue pour développer des outils et des applications 3D basées sur le cadre OpenUSD.

Ce développement s’appuie sur des efforts antérieurs réalisés par Nvidia Research. Un exemple notable est Voyager, un agent IA qui peut jouer à Minecraft de manière autonome.

Eureka dépasse les experts humains

Dans un nouvel article scientifique publié par Nvidia Research, les auteurs affirment que Eureka dépasse les récompenses conçues par des experts humains. Selon les chercheurs, Eureka «exploite la génération zéro-shot, l’écriture de code et les capacités d’amélioration en contexte» pour effectuer l’optimisation évolutive sur le code de récompense. Les récompenses résultantes peuvent être utilisées pour acquérir des compétences complexes grâce à l’apprentissage par renforcement. Dans un ensemble diversifié de 29 environnements d’apprentissage par renforcement en open source, Eureka a dépassé les experts humains dans 83% des tâches.

Eureka est une combinaison unique de grands modèles de langage et de technologies de simulation accélérées par GPU de Nvidia. On s’attend à ce que cette technologie innovante permette un contrôle dextre du robot et offre une nouvelle façon de produire des animations physiquement réalistes pour les artistes. Sans aucun doute, Eureka représente une grande avancée dans le domaine de l’apprentissage automatique et de la intelligence artificielle, ouvrant de nouvelles possibilités pour l’interaction entre les humains et les robots.

Susana Meijomil

Susana est une professionnelle remarquable dans le marketing et la communication, créatrice de contenu et experte en SEO. Elle est diplômée en Psychologie de l'Université de Santiago de Compostela et a un master en Marketing et Comportement du Consommateur de l'Université de Grenade et de l'Université de Jaén. De plus, elle a partagé ses connaissances à travers des conférences et des ateliers. Avec une vaste expérience en stratégies de marketing et de communication, Susana a réussi à optimiser la visibilité et le positionnement des marques grâce à des techniques de SEO.

Cette entrée est également disponible dans : Español Português