Selon certaines sources, il serait capable de fournir des réponses presque aussi précises que des modèles dix fois plus volumineux. Cela ne vous fait-il pas vous interroger sur son potentiel réel ?
- Microsoft a dévoilé son nouveau modèle d’IA légère, le Phi-3 Mini.
- Il est conçu pour fonctionner sur smartphones et autres appareils locaux.
- Le Phi-3 Mini est aussi performant que des modèles plus grands, malgré sa taille réduite.
- Il est désormais disponible sur Azure, Hugging Face et Ollama.
Microsoft présente son dernier joyau: le Phi-3 Mini
Microsoft a levé le voile sur son dernier modèle d’intelligence artificielle légère, le Phi-3 Mini. Conçu pour fonctionner sur des smartphones et autres appareils locaux, ce modèle est le fruit de l’apprentissage de 3,8 milliards de paramètres. Sa création est une étape cruciale vers la démocratisation de l’IA pour les petites organisations.
Un petit modèle avec de grandes performances
Selon Microsoft, le Phi-3 Mini surpasse aisément son prédécesseur, le Phi-2, et rivalise avec des modèles plus grands tels que le Llama 2. En fait, le Phi-3 Mini fournit des réponses à un niveau proche d’un modèle dix fois plus grand.
Une innovation basée sur la formation
Le cœur de l’innovation repose sur le jeu de données utilisé pour l’apprentissage du modèle. Il s’appuie sur le modèle Phi-2, mais utilise des données Web fortement filtrées et des données synthétiques pour créer de nouvelles données. Cette approche permet au modèle de langage plus petit d’être plus efficace.
Performances et limites
Le Phi-3 Mini ne peut pas encore égaler les performances des modèles de langage de machine alimentés par le cloud, mais il surpasse le Phi-2 et d’autres petits modèles dans des tâches allant des mathématiques à la programmation en passant par les tests académiques. Sa principale limitation est la largeur de la « connaissance factuelle » due à la taille plus petite de l’ensemble de données.
L’avis de la rédaction
Microsoft fait un pas audacieux vers l’avenir avec le Phi-3 Mini, offrant une alternative viable aux modèles d’IA de grande taille. Sa capacité à fonctionner sur des appareils simples et déconnectés du web pourrait révolutionner l’accessibilité de l’IA, particulièrement pour les petites organisations. C’est une avancée technologique à surveiller de près.