Un nuevo horizonte en la robótica: La inteligencia artificial de propósito general
El desafío de entrenar modelos de aprendizaje automático para cada robot, tarea y entorno ha representado una barrera significativa para el avance en el campo de la robótica. Sin embargo, un innovador proyecto liderado por Google DeepMind y 33 instituciones de investigación promete cambiar esta realidad, mediante la creación de un sistema de inteligencia artificial (IA) de propósito general.
En la actualidad, los robots son especialistas pero no generalistas. Cada uno requiere un entrenamiento específico para realizar una tarea en un entorno particular. Este enfoque no solo es costoso sino que también limita la versatilidad y aplicabilidad de los robots en diferentes contextos.
Open-X Embodiment: Un proyecto transformador
La solución propuesta es el proyecto Open-X Embodiment. Este introduce dos componentes clave: un conjunto de datos con información sobre múltiples tipos de robots y una familia de modelos capaces de transferir habilidades en una amplia gama de tareas. Las pruebas realizadas en laboratorios de robótica y en diferentes tipos de robots han obtenido resultados superiores a los métodos comúnmente utilizados.
El conjunto de datos Open X-Embodiment se creó recopilando datos de 22 encarnaciones de robots en 20 instituciones internacionales. Incluye ejemplos de más de 500 habilidades y 150,000 tareas en más de 1 millón de episodios.
Los modelos acompañantes se basan en la arquitectura transformer. El RT-1-X se construyó sobre Robotics Transformer 1 (RT-1), un modelo multitarea para robótica del mundo real a gran escala. Por otro lado, el RT-2-X se construyó sobre el sucesor de RT-1, RT-2, un modelo visión-lenguaje-acción que ha aprendido tanto datos robóticos como web.
Resultados prometedores y futuros pasos
Las pruebas de RT-1-X en varias tareas en cinco laboratorios de investigación diferentes en cinco robots comúnmente utilizados, mostraron una tasa de éxito un 50% mayor que los modelos especializados. Además, el modelo demostró su capacidad para generalizar sus habilidades a diferentes entornos. Por su parte, RT-2-X fue tres veces más exitoso que RT-2 en habilidades emergentes.
Los futuros pasos para la investigación en robótica incluyen la posibilidad de combinar estos avances con los conocimientos de RoboCat, un modelo auto-mejorable desarrollado por DeepMind. También se investigará cómo diferentes mezclas de conjuntos de datos podrían afectar la generalización entre encarnaciones y cómo se materializa la mejora.
Finalmente, el equipo ha liberado el conjunto de datos Open X-Embodiment y una versión pequeña del modelo RT-1-X. Se espera que estas herramientas transformen la forma en que se entrenan los robots y aceleren este campo de investigación. En definitiva, este proyecto representa un paso significativo hacia la creación de robots verdaderamente versátiles y adaptables.
Sarah es además de experta en marketing digital, creadora de contenido con amplia experiencia en el campo. Graduada en Sociología por la Universidad de Barcelona y con un Postgrado en Marketing Digital en Inesdi, Sarah ha logrado destacarse como Directora de Marketing Digital.
Su profundo conocimiento de las tendencias digitales y su habilidad para identificar oportunidades de crecimiento han sido fundamentales para el éxito de numerosas campañas. Además, imparte clases y conferencias en prestigiosas escuelas de negocio, universidades y eventos, compartiendo sus conocimientos y experiencias con otros profesionales y estudiantes.