Alibaba et son nouveau pari sur l’Intelligence Artificielle : EMO
Le géant technologique chinois Alibaba continue sa progression dans le domaine de l’intelligence artificielle avec la création de EMO, une nouvelle IA générative. Cette technologie innovante a la capacité de générer des vidéos de portraits à partir d’une simple image et d’un fichier vocal. Son principal attrait réside dans sa capacité à synchroniser les mouvements labiaux avec l’audio et à adapter les expressions du visage en fonction du ton de la voix. Cette avancée promet de révolutionner le monde de l’animation et du design graphique.
Caractéristiques et capacités de EMO
EMO se distingue par son excellente synchronisation labiale et l’adaptation de ses expressions en fonction du ton de la voix. Cela lui permet de générer une vidéo de portrait où le sujet semble parler et s’exprimer naturellement, bien que tout ait été généré à partir d’une image statique et d’un fichier audio. Des exemples de ce que cette IA est capable de faire sont disponibles sur la page du projet sur Github, où les développeurs ont partagé plusieurs vidéos démonstratives.
Les créateurs d’EMO sont Linrui Tian, Qi Wang, Bang Zhang et Liefeng Bo, tous membres de l’Institut d’Intelligence Computationnelle du Groupe Alibaba. Malgré les impressionnantes capacités de l’outil, les développeurs ont précisé que EMO est un outil de recherche et, pour l’instant, n’est pas disponible au public pour utilisation.
EMO peut générer des vidéos de portrait de différentes durées, en fonction de la durée du fichier audio. Cela signifie qu’il peut générer une vidéo de portrait de quelques secondes ou de plusieurs minutes, tout en maintenant la cohérence du personnage tout au long de la vidéo. Autrement dit, le sujet du portrait ne change pas d’aspect ni d’expression de manière abrupte, mais tout se déroule de manière naturelle.
Questions éthiques et légales autour d’EMO
Cependant, comme toute technologie, EMO soulève également certaines questions éthiques et juridiques. D’une part, il y a l’impact sur les droits à l’image et à la voix. La question se pose : quelqu’un pourrait-il utiliser EMO pour générer une vidéo portrait d’une personne sans son consentement ? D’autre part, il y a la possibilité d’obtenir des effets impressionnants à partir de la voix. EMO pourrait-il être utilisé pour générer des vidéos portrait de personnages de fiction, par exemple, et leur donner vie d’une manière jamais vue auparavant ? Seul le temps dira comment cette technologie se développe et comment ces questions sont résolues.
Susana est une professionnelle remarquable dans le marketing et la communication, créatrice de contenu et experte en SEO. Elle est diplômée en Psychologie de l'Université de Santiago de Compostela et a un master en Marketing et Comportement du Consommateur de l'Université de Grenade et de l'Université de Jaén. De plus, elle a partagé ses connaissances à travers des conférences et des ateliers. Avec une vaste expérience en stratégies de marketing et de communication, Susana a réussi à optimiser la visibilité et le positionnement des marques grâce à des techniques de SEO.
Cette entrée est également disponible dans : Español Português