Eureka: A revolução da IA da Nvidia que ensina robôs e supera especialistas humanos

Dos robots interactuando con computadoras en un entorno hiperrealista de tonos oscuros de verde y azul, evocando el estilo neón realista de Jean-Léon Gérôme.

Eureka: A nova IA da Nvidia Research

Nvidia Research, a divisão de pesquisa da gigante tecnológica Nvidia, desenvolveu um inovador agente de inteligência artificial (IA) batizado como Eureka. Este agente, impulsionado pelo modelo GPT-4 da OpenAI, tem a capacidade de ensinar robôs a realizar tarefas complexas de forma autônoma. Entre as habilidades que conseguiu transmitir a uma mão robótica incluem truques rápidos de girar canetas, abrir gavetas e armários, lançar e pegar bolas e manipular tesouras. No total, Eureka treinou a mão robótica para realizar quase 30 tarefas diferentes.

Eureka: Um avanço no desenvolvimento de algoritmos

Mas Eureka não apenas ensina habilidades aos robôs. Também é capaz de escrever algoritmos de recompensa de maneira autônoma. Este avanço representa um primeiro passo para o desenvolvimento de novos algoritmos que integram métodos generativos e de aprendizado por reforço para resolver tarefas difíceis.

Para facilitar o acesso a esta tecnologia, a Nvidia Research publicou a biblioteca Eureka de algoritmos de IA. Os usuários podem experimentar com esses algoritmos usando o Nvidia Isaac Gym, uma aplicação de referência para simulação física na pesquisa de aprendizado por reforço. O Isaac Gym é construído sobre o Nvidia Omniverse, uma plataforma projetada para desenvolver ferramentas e aplicações 3D baseadas no framework OpenUSD.

Este desenvolvimento se baseia em esforços anteriores realizados pela Nvidia Research. Um exemplo notável é o Voyager, um agente de IA que pode jogar Minecraft de forma autônoma.

Eureka supera os especialistas humanos

Em um novo artigo científico publicado pela Nvidia Research, os autores afirmam que Eureka supera as recompensas projetadas por especialistas humanos. Segundo os pesquisadores, Eureka «explora a geração zero-shot, a escrita de código e as capacidades de melhoria no contexto» para realizar a otimização evolutiva sobre o código de recompensa. As recompensas resultantes podem ser usadas para adquirir habilidades complexas através do aprendizado por reforço. Em um conjunto diversificado de 29 ambientes de aprendizado por reforço de código aberto, Eureka superou os especialistas humanos em 83% das tarefas.

Eureka é uma combinação única de grandes modelos de linguagem e tecnologias de simulação aceleradas por GPU da Nvidia. Espera-se que esta tecnologia inovadora permita o controle dexterous do robô e forneça uma nova maneira de produzir animações fisicamente realistas para os artistas. Sem dúvida, Eureka representa um grande avanço no campo da aprendizagem automática e da inteligência artificial, abrindo novas possibilidades para a interação entre humanos e robôs.

Susana é uma profissional destacada em marketing e comunicação, criadora de conteúdo e especialista em SEO. Ela é formada em Psicologia pela Universidade de Santiago de Compostela e tem um mestrado em Marketing e Comportamento do Consumidor pela Universidade de Granada e Universidade de Jaén. Além disso, compartilhou seus conhecimentos através de conferências e workshops. Com ampla experiência em estratégias de marketing e comunicação, Susana conseguiu otimizar a visibilidade e o posicionamento das marcas através de técnicas de SEO.

Esta entrada também está disponível em: Español Français

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *