Um novo horizonte na robótica: A inteligência artificial de propósito geral
O desafio de treinar modelos de aprendizado de máquina para cada robô, tarefa e ambiente tem sido uma barreira significativa para o avanço no campo da robótica. No entanto, um inovador projeto liderado pelo Google DeepMind e 33 instituições de pesquisa promete mudar essa realidade, através da criação de um sistema de inteligência artificial (IA) de propósito geral.
Atualmente, os robôs são especialistas, mas não generalistas. Cada um requer um treinamento específico para realizar uma tarefa em um ambiente particular. Esta abordagem não só é cara, mas também limita a versatilidade e aplicabilidade dos robôs em diferentes contextos.
Open-X Embodiment: Um projeto transformador
A solução proposta é o projeto Open-X Embodiment. Este introduz dois componentes chave: um conjunto de dados com informações sobre vários tipos de robôs e uma família de modelos capazes de transferir habilidades numa ampla gama de tarefas. Os testes realizados em laboratórios de robótica e em diferentes tipos de robôs obtiveram resultados superiores aos métodos comumente utilizados.
O conjunto de dados Open X-Embodiment foi criado coletando dados de 22 encarnações de robôs em 20 instituições internacionais. Inclui exemplos de mais de 500 habilidades e 150.000 tarefas em mais de 1 milhão de episódios.
Os modelos acompanhantes são baseados na arquitetura transformer. O RT-1-X foi construído sobre o Robotics Transformer 1 (RT-1), um modelo multitarefa para robótica em grande escala no mundo real. Por outro lado, o RT-2-X foi construído sobre o sucessor do RT-1, o RT-2, um modelo visão-linguagem-ação que aprendeu tanto dados robóticos quanto da web.
Resultados promissores e próximos passos
Os testes do RT-1-X em várias tarefas em cinco laboratórios de pesquisa diferentes em cinco robôs comumente utilizados, mostraram uma taxa de sucesso 50% maior do que os modelos especializados. Além disso, o modelo demonstrou sua capacidade de generalizar suas habilidades para diferentes ambientes. Por sua vez, o RT-2-X foi três vezes mais bem-sucedido que o RT-2 em habilidades emergentes.
Os futuros passos para a pesquisa em robótica incluem a possibilidade de combinar esses avanços com os conhecimentos do RoboCat, um modelo auto-aperfeiçoável desenvolvido pela DeepMind. Também será investigado como diferentes combinações de conjuntos de dados podem afetar a generalização entre encarnações e como o aperfeiçoamento se materializa.
Finalmente, a equipe liberou o conjunto de dados Open X-Embodiment e uma versão menor do modelo RT-1-X. Espera-se que essas ferramentas transformem a maneira como os robôs são treinados e acelerem este campo de pesquisa. Em suma, este projeto representa um passo significativo para a criação de robôs verdadeiramente versáteis e adaptáveis.
Sarah é, além de uma especialista em marketing digital, uma criadora de conteúdo com vasta experiência no campo. Graduada em Sociologia pela Universidade de Barcelona e com uma Pós-graduação em Marketing Digital pelo Inesdi, Sarah conseguiu se destacar como Diretora de Marketing Digital. Seu profundo conhecimento das tendências digitais e sua habilidade para identificar oportunidades de crescimento foram fundamentais para o sucesso de inúmeras campanhas. Além disso, ela dá aulas e palestras em prestigiosas escolas de negócios, universidades e eventos, compartilhando seus conhecimentos e experiências com outros profissionais e estudantes.