De Speak & Spell a OpenAI: A Revolução da Síntese de Voz e suas Implicações Éticas

OpenAI e sua revolucionária tecnologia de voz

Desde o brinquedo Speak & Spell de 1978, que permitia às crianças praticar a ortografia com uma voz robótica, até os atuais modelos de inteligência artificial (IA) de aprendizado profundo, a síntese de voz passou por uma evolução espetacular. Nesse contexto, a OpenAI apresentou seu modelo de IA de texto para voz, Voice Engine, que promete revolucionar ainda mais este campo.

O Voice Engine tem a capacidade de criar vozes sintéticas a partir de um segmento de áudio gravado de apenas 15 segundos. Uma vez clonada uma voz, o usuário pode inserir texto e obter um resultado de voz gerado por IA. Inicialmente, a OpenAI planejou lançar um programa piloto para desenvolvedores para a API do Voice Engine, mas decidiu não fazê-lo devido às implicações éticas que isso poderia acarretar.

A evolução da tecnologia de clonagem de voz

A tecnologia de clonagem de voz não é nova. Desde 2022, existem vários modelos de síntese de voz IA, e a comunidade de código aberto contribuiu com pacotes como OpenVoice e XTTSv2. No entanto, o que torna notório o OpenAI é a sua abordagem para permitir o uso de sua tecnologia de voz.

Benefícios e desafios éticos da tecnologia de voz

Os benefícios da tecnologia de voz do OpenAI são múltiplos. Pode auxiliar na leitura através de vozes naturais, permitir que os criadores de conteúdo alcancem uma audiência global traduzindo seu conteúdo e preservando sotaques nativos, apoiar indivíduos não verbais com opções de fala personalizadas e auxiliar pacientes a recuperar sua própria voz após condições que afetam a fala.

No entanto, esta tecnologia também levanta implicações éticas e riscos significativos. A possibilidade de clonar qualquer voz com 15 segundos de áudio gravado abre a porta para um uso indevido potencial, como fraudes telefônicas e robocalls de campanhas eleitorais. Além disso, existem riscos de segurança, como o acesso a contas bancárias que utilizam autenticação de voz.

A OpenAI está ciente desses possíveis problemas se a tecnologia for amplamente divulgada. Por isso, implementou um conjunto de regras para contornar esses problemas e vem testando a tecnologia com um conjunto de empresas parceiras selecionadas desde o ano passado. Desta forma, a OpenAI busca garantir que sua revolucionária tecnologia de voz seja usada de maneira responsável e segura.

Sandra Palencia

Sandra é especialista em marketing digital e experta em redes sociais. Ela completou uma pós-graduação em Comunicação e RP para marcas de moda no Idep Barcelona, além de outra em Marketing e reputação online: comunidades virtuais. Sandra está a par das últimas tendências e melhores práticas em redes sociais, e isso se reflete em seu trabalho diário, gerando um impacto positivo no mundo digital.

Esta entrada também está disponível em: Español Français