ElevenLabs présente AI Dubbing : Innovation dans la traduction de contenu audiovisuel
La start-up ElevenLabs, spécialisée dans le clonage et la synthèse vocale, a lancé AI Dubbing, un produit révolutionnaire capable de traduire n’importe quel discours en plus de 20 langues. Ce lancement représente une avancée importante dans l’élimination des barrières linguistiques pour les créateurs de contenu.
AI Dubbing est disponible pour tous les utilisateurs de la plateforme ElevenLabs. Cette méthode innovante pour doubler le contenu audiovisuel promet de transformer le paysage du secteur. La start-up a travaillé conjointement avec des centaines de créateurs pour tester et perfectionner cette fonction, dans le but d’offrir un outil efficace et facile à utiliser.
Fonctionnement et capacités d’AI Dubbing
Le fonctionnement d’AI Dubbing est entièrement automatique : il identifie le nombre de locuteurs dans un contenu et traduit leur discours dans une autre langue. Pour cela, il utilise une méthode brevetée par ElevenLabs qui filtre le bruit de fond et distingue la musique et le bruit du dialogue réel. Par la suite, il transcrit le dialogue original en texte, le traduit et l’adapte à la langue cible tout en conservant les caractéristiques vocales originales du locuteur.
Pour générer le discours final à partir du texte traduit, AI Dubbing utilise le modèle Multilingue v2. Ce modèle prend en charge plus de 20 langues, dont l’hindi, le portugais, l’espagnol, le japonais, l’ukrainien, le polonais et l’arabe.
Cependant, AI Dubbing présente certaines limites. Par exemple, il existe une limite à la quantité de caractères qui peuvent être traduits en une seule fonction. Auparavant, ElevenLabs proposait des outils séparés pour le clonage vocal et la synthèse de texte à la parole.
Le paysage concurrentiel de la synthèse vocale propulsée par l’IA
Les progrès dans les voix basées sur l’IA ne sont pas exclusifs à ElevenLabs. D’autres entreprises, comme OpenAI soutenue par Microsoft, explorent également cette technologie. Ces entreprises utilisent des modèles de texte à parole et de parole à texte pour convertir l’audio et collaborent avec des partenaires sélectionnés pour prévenir l’abus de ces capacités.
Dans l’espace de synthèse vocale et de parole propulsé par l’IA, il y a d’autres acteurs actifs tels que MURF.AI, Play.ht et WellSaid Labs. Récemment, Meta a lancé SeamlessM4T, un modèle multilingue open source. Selon les estimations, on s’attend à ce que le marché mondial pour ces outils atteigne près de 5 milliards de dollars en 2032.
En conclusion, AI Dubbing d’ElevenLabs représente une grande avancée dans l’élimination des barrières linguistiques pour les créateurs de contenu. Malgré les limitations existantes et une forte concurrence dans le secteur, la startup est bien positionnée pour diriger ce marché émergent.
Sarah est non seulement une experte en marketing digital, mais aussi une créatrice de contenu avec une grande expérience dans le domaine. Diplômée en Sociologie de l'Université de Barcelone et ayant un post-diplôme en Marketing Digital de l'Inesdi, Sarah a réussi à se distinguer en tant que Directrice de Marketing Digital. Sa connaissance approfondie des tendances digitales et sa capacité à identifier des opportunités de croissance ont été fondamentales pour le succès de nombreuses campagnes. De plus, elle donne des cours et des conférences dans des écoles de commerce prestigieuses, des universités et des événements, partageant ses connaissances et expériences avec d'autres professionnels et étudiants.
Cette entrée est également disponible dans : Español Português