OpenAI lanza Voice Engine, una revolucionaria tecnología de clonación de voz
OpenAI, la prestigiosa organización de investigación en inteligencia artificial, ha presentado su última innovación: Voice Engine. Esta tecnología, en desarrollo desde 2022, es capaz de clonar cualquier voz a partir de una muestra de tan solo 15 segundos. Su eficacia y versatilidad ya han sido demostradas en la API de texto a voz de OpenAI y en la voz de ChatGPT.
El funcionamiento de Voice Engine es sencillo pero impresionante. Solo necesita una muestra de voz de 15 segundos y un poco de texto para clonar una voz. OpenAI destaca que incluso un modelo pequeño puede crear voces emotivas y realistas, lo que abre un abanico de posibilidades para su uso.
Aplicaciones prometedoras y potenciales riesgos
Las aplicaciones de Voice Engine son variadas y prometedoras. En el ámbito de la asistencia a la lectura, puede permitir a los niños o a las personas que no saben leer escuchar el texto con una voz más natural, facilitando su comprensión. En el campo de la traducción y el doblaje, Voice Engine puede traducir y doblar lo dicho a otros idiomas, conservando el acento original, lo que podría revolucionar la industria del cine y la televisión. Además, puede ser de gran ayuda para las personas con problemas de habla, ya que puede restaurar la voz de una persona que ha perdido la fluidez del habla debido a un problema de salud.
Sin embargo, como toda tecnología avanzada, Voice Engine también presenta potenciales riesgos. El más evidente es la suplantación de identidad y la creación de deepfakes, es decir, contenidos falsos hiperrealistas. OpenAI es plenamente consciente de estos riesgos y, por ello, no ha desplegado el modelo a gran escala.
Medidas propuestas para mitigar los riesgos
Para mitigar estos riesgos, OpenAI ha propuesto varias medidas. Una de ellas es la autenticación de voz, que verificaría que el hablante original está añadiendo su voz al servicio con conocimiento de causa. También se plantea la creación de una lista de voces prohibidas que detecte e impida la creación de voces demasiado parecidas a figuras prominentes. Además, OpenAI sugiere eliminar progresivamente la autenticación basada en la voz como medida de seguridad para acceder a cuentas bancarias y otra información sensible, ya que podría ser fácilmente falsificada con esta tecnología. Por último, la organización está explorando políticas para proteger el uso de la voz de las personas en la IA, para evitar su uso indebido.
En conclusión, Voice Engine de OpenAI es una tecnología prometedora con un gran potencial, pero también con riesgos que deben ser gestionados de manera responsable. Es un paso más hacia un futuro en el que la inteligencia artificial será cada vez más presente en nuestras vidas.
Sandra es especialista en marketing digital y experta en redes sociales. Ha completado un posgrado en Comunicación y RRPP de marcas de moda en Idep Barcelona, así como otro en Marketing y reputación online: comunidades virtuales. Sandra está al tanto de las últimas tendencias y mejores prácticas en redes sociales, y eso se refleja en su trabajo diario generando un impacto positivo en el mundo digital.