ElevenLabs presenta AI Dubbing: Innovación en la traducción de contenido audiovisual
La startup ElevenLabs, especializada en clonación y síntesis de voz, ha lanzado AI Dubbing, un producto revolucionario capaz de traducir cualquier discurso a más de 20 idiomas. Este lanzamiento supone un importante paso adelante en la eliminación de barreras lingüísticas para los creadores de contenido.
AI Dubbing está disponible para todos los usuarios de la plataforma ElevenLabs. Este innovador método para doblar contenido audiovisual promete transformar el panorama del sector. La startup ha trabajado conjuntamente con cientos de creadores para probar y perfeccionar esta función, con el objetivo de ofrecer una herramienta eficiente y fácil de usar.
Funcionamiento y capacidades del AI Dubbing
El funcionamiento de AI Dubbing es completamente automático: identifica el número de hablantes en un contenido y traduce su discurso a otro idioma. Para ello, utiliza un método patentado por ElevenLabs que filtra el ruido de fondo y distingue la música y el ruido del diálogo real. Posteriormente, transcribe el diálogo original a texto, lo traduce y lo adapta al idioma objetivo manteniendo las características vocales originales del hablante.
Para generar el discurso final a partir del texto traducido, AI Dubbing emplea el modelo Multilingual v2. Este modelo soporta más de 20 idiomas, entre los que se incluyen hindi, portugués, español, japonés, ucraniano, polaco y árabe.
No obstante, AI Dubbing presenta algunas limitaciones. Por ejemplo, existe un límite en la cantidad de caracteres que se pueden traducir en una sola función. Anteriormente, ElevenLabs ofrecía herramientas separadas para la clonación de voz y la síntesis de texto a voz.
El panorama competitivo de la síntesis de voz impulsada por IA
El avance en voces basadas en IA no es exclusivo de ElevenLabs. Otras empresas, como OpenAI respaldada por Microsoft, también están explorando esta tecnología. Estas empresas utilizan modelos de texto a voz y voz a texto para convertir audio y colaboran con socios selectos para prevenir el mal uso de estas capacidades.
En el espacio de síntesis de voz y habla impulsado por IA, hay otros jugadores activos como MURF.AI, Play.ht y WellSaid Labs. Recientemente, Meta lanzó SeamlessM4T, un modelo multilingüe de código abierto. Según las estimaciones, se espera que el mercado global para estas herramientas alcance casi $5 mil millones en 2032.
En conclusión, AI Dubbing de ElevenLabs representa un gran avance en la eliminación de barreras lingüísticas para los creadores de contenido. A pesar de las limitaciones existentes y una competencia fuerte en el sector, la startup está bien posicionada para liderar este mercado emergente.
Sarah es además de experta en marketing digital, creadora de contenido con amplia experiencia en el campo. Graduada en Sociología por la Universidad de Barcelona y con un Postgrado en Marketing Digital en Inesdi, Sarah ha logrado destacarse como Directora de Marketing Digital.
Su profundo conocimiento de las tendencias digitales y su habilidad para identificar oportunidades de crecimiento han sido fundamentales para el éxito de numerosas campañas. Además, imparte clases y conferencias en prestigiosas escuelas de negocio, universidades y eventos, compartiendo sus conocimientos y experiencias con otros profesionales y estudiantes.