Alibaba e sua nova aposta em Inteligência Artificial: EMO
O gigante tecnológico chinês Alibaba continua avançando no campo da inteligência artificial com a criação do EMO, uma nova IA generativa. Esta tecnologia inovadora tem a capacidade de gerar vídeos de retratos a partir de uma simples imagem e um arquivo de voz. Seu principal atrativo reside na sua habilidade de sincronizar os movimentos labiais com o áudio e adaptar as expressões faciais de acordo com o tom de voz. Este avanço promete revolucionar o mundo da animação e do design gráfico.
Características e capacidades do EMO
O EMO se destaca pela excelente sincronização labial e adaptação de expressões de acordo com o tom de voz. Isso permite gerar um vídeo de retrato no qual o sujeito parece falar e se expressar de maneira natural, mesmo que tudo tenha sido gerado a partir de uma imagem estática e um arquivo de áudio. Exemplos do que essa IA é capaz de fazer estão disponíveis na página do projeto no Github, onde os desenvolvedores compartilharam vários vídeos demonstrativos.
Os criadores do EMO são Linrui Tian, Qi Wang, Bang Zhang e Liefeng Bo, todos membros do Instituto de Inteligência Computacional do Grupo Alibaba. Apesar da impressionante capacidade da ferramenta, os desenvolvedores esclareceram que o EMO é uma ferramenta de pesquisa e, por enquanto, não está disponível ao público para uso.
O EMO pode gerar vídeos de retrato de diferentes durações, dependendo do tempo do arquivo de áudio. Isso significa que pode gerar um vídeo de retrato de alguns segundos ou de vários minutos, sempre mantendo a consistência do personagem durante todo o vídeo. Ou seja, o sujeito do retrato não muda de aparência ou expressão de maneira abrupta, mas tudo flui de maneira natural.
Questões éticas e legais em torno do EMO
No entanto, como toda tecnologia, o EMO também levanta algumas questões éticas e legais. Por um lado, há o impacto nos direitos de imagem e voz. Surge a pergunta: Alguém poderia usar o EMO para gerar um vídeo retrato de uma pessoa sem o seu consentimento? Por outro lado, há a possibilidade de obter efeitos impressionantes a partir da voz. O EMO poderia ser usado para gerar vídeos retrato de personagens fictícios, por exemplo, e dar-lhes vida de uma maneira nunca antes vista? Só o tempo dirá como essa tecnologia se desenvolverá e como essas questões serão resolvidas.
Susana é uma profissional destacada em marketing e comunicação, criadora de conteúdo e especialista em SEO. Ela é formada em Psicologia pela Universidade de Santiago de Compostela e tem um mestrado em Marketing e Comportamento do Consumidor pela Universidade de Granada e Universidade de Jaén. Além disso, compartilhou seus conhecimentos através de conferências e workshops. Com ampla experiência em estratégias de marketing e comunicação, Susana conseguiu otimizar a visibilidade e o posicionamento das marcas através de técnicas de SEO.