EMO: La revolucionaria IA de Alibaba que da vida a retratos con solo una imagen y tu voz

Alibaba y su nueva apuesta en Inteligencia Artificial: EMO

El gigante tecnológico chino Alibaba continúa su avance en el campo de la inteligencia artificial con la creación de EMO, una nueva IA generativa. Esta innovadora tecnología tiene la capacidad de generar videos de retratos a partir de una simple imagen y un archivo de voz. Su principal atractivo radica en su habilidad para sincronizar los movimientos labiales con el audio y adaptar las expresiones del rostro en función del tono de voz. Este avance promete revolucionar el mundo de la animación y el diseño gráfico.

Características y capacidades de EMO

EMO se distingue por su excelente sincronización labial y adaptación de expresiones en función del tono de voz. Esto le permite generar un video de retrato en el que el sujeto parece hablar y expresarse de manera natural, a pesar de que todo se ha generado a partir de una imagen estática y un archivo de audio. Los ejemplos de lo que esta IA es capaz de hacer están disponibles en la página del proyecto en Github, donde los desarrolladores han compartido varios videos demostrativos.

Los creadores de EMO son Linrui Tian, Qi Wang, Bang Zhang y Liefeng Bo, todos ellos miembros del Instituto de Inteligencia Computacional del Grupo Alibaba. A pesar de la impresionante capacidad de la herramienta, los desarrolladores han aclarado que EMO es una herramienta de investigación y, por el momento, no está disponible al público para su uso.

EMO puede generar videos de retrato de distinto tiempo, en función de la duración del archivo de audio. Esto significa que puede generar un video de retrato de pocos segundos o de varios minutos, siempre manteniendo la consistencia del personaje durante todo el video. Es decir, el sujeto del retrato no cambia de aspecto ni de expresión de manera abrupta, sino que todo fluye de manera natural.

Cuestiones éticas y legales en torno a EMO

Sin embargo, como toda tecnología, EMO también plantea algunas cuestiones éticas y legales. Por un lado, está el impacto en los derechos de imagen y voz. Surge la pregunta: ¿Podría alguien usar EMO para generar un video de retrato de una persona sin su consentimiento? Por otro lado, está la posibilidad de conseguir efectos impresionantes a partir de la voz. ¿Podría usarse EMO para generar videos de retrato de personajes de ficción, por ejemplo, y darles vida de una manera nunca antes vista? Solo el tiempo dirá cómo se desarrolla esta tecnología y cómo se resuelven estas cuestiones.

Susana Meijomil

Susana es una profesional destacada en marketing y comunicación, creadora de contenido y experta en SEO. Es licenciada en Psicología por la Universidad de Santiago de Compostela y cuenta con un máster en Marketing y Comportamiento del Consumidor de la Universidad de Granada y la Universidad de Jaén. Además, ha compartido sus conocimientos a través de conferencias y workshops.
Con amplia experiencia en estrategias de marketing y comunicación, Susana ha logrado optimizar la visibilidad y el posicionamiento de las marcas a través de técnicas de SEO.

Esta entrada también está disponible en: Français Português