DeepSeek AI lance sa propre intelligence artificielle conversationnelle
Le géant technologique chinois, DeepSeek AI, a présenté sa nouvelle intelligence artificielle conversationnelle, DeepSeek Chat. Ce lancement intervient dans une tentative de concurrencer le populaire ChatGPT et a été réalisé dans le cadre d’un test alpha. La nouvelle IA utilise des modèles d’apprentissage automatique de langage (LLM) de 7B et 67B paramètres.
Les modèles LLM de DeepSeek Chat ont été formés sur un ensemble de données massif de 2 billions de tokens en anglais et en chinois. Les résultats préliminaires montrent une forte performance dans une variété d’évaluations, y compris la codification et les mathématiques. De plus, les modèles ont été publiés en open source pour encourager la recherche.
Architecture et performance du modèle
Les deux modèles utilisent la même architecture de décodeur transformateur auto-régressif que Llama, une IA conversationnelle populaire. Le modèle le plus petit utilise l’attention multi-tête (MHA), tandis que le plus grand utilise l’attention par requête groupée (GQA). Les détails de l’entraînement et les taux d’apprentissage pour chaque modèle n’ont pas encore été révélés.
En termes de performance, le modèle LLM 67B Base de DeepSeek a démontré des capacités générales supérieures, surpassant le Llama2 70B Base dans des domaines tels que le raisonnement, la codification, les mathématiques et la compréhension du chinois. La version chat du modèle a également excellé dans des tests jamais vus auparavant.
Censure et compétition dans l’espace IA
Cependant, il a été signalé que le modèle subit un certain niveau de censure, en particulier avec des questions liées à la Chine. C’est un sujet délicat qui pourrait affecter l’adoption du modèle par le public international.
Le lancement des LLMs de DeepSeek marque un autre mouvement notable de la Chine dans l’espace de l’IA. Parmi les autres offres d’IA à usage général annoncées récemment figurent Baidu’s Ernie 4.0, 01.AI’s Yi 34B et les modèles de Qwen.
Il est intéressant de noter que certains modèles plus petits ont montré une performance encore meilleure que leurs homologues plus grands. Cela signifie que les entreprises peuvent économiser des ressources informatiques tout en visant des cas d’utilisation avec le même niveau d’efficacité.
Dans des travaux connexes, Microsoft a également partagé son travail dans le même domaine avec le lancement des modèles Orca 2. C’est un indicateur clair de l’intérêt croissant et de la concurrence dans le domaine de l’intelligence artificielle conversationnelle.
Sarah est non seulement une experte en marketing digital, mais aussi une créatrice de contenu avec une grande expérience dans le domaine. Diplômée en Sociologie de l'Université de Barcelone et ayant un post-diplôme en Marketing Digital de l'Inesdi, Sarah a réussi à se distinguer en tant que Directrice de Marketing Digital. Sa connaissance approfondie des tendances digitales et sa capacité à identifier des opportunités de croissance ont été fondamentales pour le succès de nombreuses campagnes. De plus, elle donne des cours et des conférences dans des écoles de commerce prestigieuses, des universités et des événements, partageant ses connaissances et expériences avec d'autres professionnels et étudiants.
Cette entrée est également disponible dans : Español Português