OpenAI lança Voice Engine, uma revolucionária tecnologia de clonagem de voz
OpenAI, a prestigiosa organização de pesquisa em inteligência artificial, apresentou sua última inovação: Voice Engine. Esta tecnologia, em desenvolvimento desde 2022, é capaz de clonar qualquer voz a partir de uma amostra de apenas 15 segundos. Sua eficácia e versatilidade já foram demonstradas na API de texto para voz da OpenAI e na voz do ChatGPT.
O funcionamento do Voice Engine é simples, mas impressionante. Ele só precisa de uma amostra de voz de 15 segundos e um pouco de texto para clonar uma voz. A OpenAI destaca que até mesmo um modelo pequeno pode criar vozes emotivas e realistas, o que abre um leque de possibilidades para seu uso.
Aplicações promissoras e potenciais riscos
As aplicações do Voice Engine são variadas e promissoras. No campo da assistência à leitura, pode permitir que crianças ou pessoas que não sabem ler ouçam o texto com uma voz mais natural, facilitando a compreensão. No campo da tradução e dublagem, o Voice Engine pode traduzir e dublar o que foi dito em outros idiomas, mantendo o sotaque original, o que poderia revolucionar a indústria do cinema e da televisão. Além disso, pode ser de grande ajuda para pessoas com problemas de fala, pois pode restaurar a voz de uma pessoa que perdeu a fluência da fala devido a um problema de saúde.
No entanto, como toda tecnologia avançada, o Voice Engine também apresenta riscos potenciais. O mais evidente é a usurpação de identidade e a criação de deepfakes, ou seja, conteúdos falsos hiper-realistas. A OpenAI está plenamente ciente desses riscos e, por isso, não implementou o modelo em larga escala.
Medidas propostas para mitigar os riscos
Para mitigar esses riscos, a OpenAI propôs várias medidas. Uma delas é a autenticação de voz, que verificaria se o falante original está adicionando sua voz ao serviço com conhecimento de causa. Também se considera a criação de uma lista de vozes proibidas que detecte e impeça a criação de vozes muito semelhantes a figuras proeminentes. Além disso, a OpenAI sugere eliminar progressivamente a autenticação baseada na voz como medida de segurança para acessar contas bancárias e outras informações sensíveis, pois poderia ser facilmente falsificada com essa tecnologia. Por fim, a organização está explorando políticas para proteger o uso da voz das pessoas na IA, para evitar seu uso indevido.
Em conclusão, o Voice Engine da OpenAI é uma tecnologia promissora com grande potencial, mas também com riscos que devem ser gerenciados de forma responsável. É mais um passo em direção a um futuro em que a inteligência artificial será cada vez mais presente em nossas vidas.
Sandra é especialista em marketing digital e experta em redes sociais. Ela completou uma pós-graduação em Comunicação e RP para marcas de moda no Idep Barcelona, além de outra em Marketing e reputação online: comunidades virtuais. Sandra está a par das últimas tendências e melhores práticas em redes sociais, e isso se reflete em seu trabalho diário, gerando um impacto positivo no mundo digital.