OpenAI lance Voice Engine, une technologie révolutionnaire de clonage de voix
OpenAI, la prestigieuse organisation de recherche en intelligence artificielle, a présenté sa dernière innovation : Voice Engine. Cette technologie, en développement depuis 2022, est capable de cloner n’importe quelle voix à partir d’un échantillon de seulement 15 secondes. Son efficacité et sa polyvalence ont déjà été démontrées dans l’API de texte à voix d’OpenAI et dans la voix de ChatGPT.
Le fonctionnement de Voice Engine est simple mais impressionnant. Il a seulement besoin d’un échantillon de voix de 15 secondes et d’un peu de texte pour cloner une voix. OpenAI souligne qu’un petit modèle peut créer des voix émotives et réalistes, ouvrant ainsi un large éventail de possibilités pour son utilisation.
Applications prometteuses et risques potentiels
Les applications de Voice Engine sont variées et prometteuses. Dans le domaine de l’assistance à la lecture, il peut permettre aux enfants ou aux personnes qui ne savent pas lire d’écouter le texte avec une voix plus naturelle, facilitant ainsi leur compréhension. Dans le domaine de la traduction et du doublage, Voice Engine peut traduire et doubler ce qui est dit dans d’autres langues, tout en conservant l’accent original, ce qui pourrait révolutionner l’industrie du cinéma et de la télévision. De plus, il peut être d’une grande aide pour les personnes ayant des problèmes de parole, car il peut restaurer la voix d’une personne qui a perdu la fluidité de la parole en raison d’un problème de santé.
Cependant, comme toute technologie avancée, Voice Engine présente également des risques potentiels. Le plus évident est l’usurpation d’identité et la création de deepfakes, c’est-à-dire des contenus faux hyper réalistes. OpenAI est pleinement conscient de ces risques et, pour cette raison, n’a pas déployé le modèle à grande échelle.
Mesures proposées pour atténuer les risques
Pour atténuer ces risques, OpenAI a proposé plusieurs mesures. L’une d’elles est l’authentification vocale, qui vérifierait que le locuteur original ajoute sa voix au service en connaissance de cause. Il est également envisagé de créer une liste de voix interdites qui détecte et empêche la création de voix trop similaires à des personnalités en vue. De plus, OpenAI suggère d’éliminer progressivement l’authentification basée sur la voix comme mesure de sécurité pour accéder aux comptes bancaires et à d’autres informations sensibles, car elle pourrait être facilement falsifiée avec cette technologie. Enfin, l’organisation explore des politiques pour protéger l’utilisation de la voix des personnes dans l’IA, afin d’éviter son utilisation abusive.
En conclusion, Voice Engine d’OpenAI est une technologie prometteuse avec un grand potentiel, mais aussi avec des risques qui doivent être gérés de manière responsable. C’est un pas de plus vers un avenir où l’intelligence artificielle sera de plus en plus présente dans nos vies.
Sandra est spécialiste en marketing digital et experte en réseaux sociaux. Elle a obtenu un post-diplôme en Communication et RP pour les marques de mode à Idep Barcelone, ainsi qu'un autre en Marketing et réputation en ligne : communautés virtuelles. Sandra est au courant des dernières tendances et des meilleures pratiques sur les réseaux sociaux, ce qui se reflète dans son travail quotidien en générant un impact positif dans le monde numérique.
Cette entrée est également disponible dans : Español Português