Phi-2 : Le nouveau modèle de langage de Microsoft Research
Microsoft Research a récemment annoncé le lancement de Phi-2, son nouveau modèle de langage compact. Malgré sa petite taille, ce modèle a démontré une performance comparable à celle des modèles plus grands, mettant ainsi en évidence les capacités de ces systèmes plus compacts.
Performance et efficacité dans un format réduit
Le Phi-2 est remarquable pour sa capacité à fonctionner sur un ordinateur portable ou un appareil mobile, ce qui le rend accessible et pratique pour un large éventail d’utilisateurs. Bien qu’il compte 2,7 milliards de paramètres – les connexions entre les neurones artificiels – ce nombre peut sembler petit comparé aux modèles plus grands comme Llama 2-7B de Meta et Mistral-7B. Cependant, la performance du Phi-2 est étonnamment comparable.
Dans une comparaison directe avec d’autres modèles, Phi-2 surpasse le nouveau modèle Gemini Nano 2 de Google malgré le fait qu’il ait un demi-milliard de paramètres en plus. De plus, Microsoft Research a signalé que Phi-2 présente moins de « toxicité » et de biais dans ses réponses que Llama 2, ce qui suggère une plus grande précision et fiabilité dans ses résultats.
Microsoft a également remis en question la démonstration vidéo de Google pour Gemini. Selon l’entreprise, Phi-2 a également pu répondre correctement à la question posée et corriger l’étudiant en utilisant les mêmes indicateurs que Google a utilisés pour démontrer l’efficacité de Gemini.
Limitations et perspectives futures
Cependant, le modèle Phi-2 a ses limites. Il est licencié uniquement pour des « fins de recherche », et non pour un usage commercial, sous une licence personnalisée de Microsoft Research. Cela signifie que les entreprises qui cherchent à construire des produits sur lui ne peuvent pas le faire en raison des restrictions de la licence.
Malgré ces limitations, le lancement de Phi-2 souligne les progrès continus dans le développement de modèles de langage plus petits et plus efficaces. Bien que son utilisation soit limitée par des restrictions de licence, le modèle Phi-2 de Microsoft Research représente une avancée significative en termes de performance et d’efficacité.
Clara est créatrice et éditrice de contenus, avec une solide formation en sciences et une spécialisation en intelligence artificielle. Sa passion pour ce domaine en constante évolution l'a amenée à acquérir les connaissances nécessaires pour comprendre et communiquer les avancées les plus récentes dans ce domaine. Grâce à son expérience et à ses compétences en rédaction et édition de contenus, Clara est capable de transmettre de manière claire et efficace des concepts complexes liés à l'intelligence artificielle et ainsi les rendre accessibles à tous types de publics.
Cette entrée est également disponible dans : Español Português