AI

Microsoft erweitert sein KI-Portfolio mit neuen Phi-3.5-Modellen: Ein großer Schritt in Richtung leistungsstarker Multimodalität

Microsoft a présenté trois nouveaux modèles de la série Phi-3.5, marquant des progrès significatifs sur la voie de la position de leader dans le développement de l'IA.

Eulerpool News 27 août 2024, 11:01

Microsoft poursuit sa série de succès impressionnants dans le domaine de l'intelligence artificielle et annonce aujourd'hui la sortie de trois nouveaux modèles de la série Phi-3.5. Ces modèles, dotés de fonctions avancées de multimodalité et de multilinguisme, visent à révolutionner davantage le marché des applications basées sur l'IA. Les modèles ont été mis à disposition sur Hugging Face sous une licence MIT brandée Microsoft, offrant aux développeurs du monde entier la possibilité d'utiliser, d'adapter et de développer librement ces technologies innovantes.

Voici la traduction en français du titre :

"Les trois modèles – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct et Phi-3.5-vision-instruct – couvrent un large éventail d'applications, des tâches basiques aux tâches hautement complexes. Chaque modèle est optimisé pour des besoins spécifiques, comme par exemple le raisonnement rapide et précis ou le traitement de données textuelles et visuelles dans des tâches multimodales.

Das Phi-3.5 Mini Instruct Modell, ausgestattet mit 3,8 Milliarden Parametern, ist ein leichtgewichtiges Modell, das speziell für den Einsatz in speicher- oder rechenbeschränkten Umgebungen entwickelt wurde. Es zeigt beeindruckende Leistungen in Aufgaben, die starkes Reasoning erfordern, wie etwa Code-Generierung, mathematische Problemlösungen und logikbasierte Abfragen. Trotz seiner kompakten Größe übertrifft es auf dem RepoQA-Benchmark andere Modelle seiner Klasse, wie das Llama-3.1-8B-instruct, insbesondere bei Aufgaben, die ein Verständnis von langen Kontexten erfordern.

Le modèle Phi-3.5 Mini Instruct, doté de 3,8 milliards de paramètres, est un modèle léger spécialement conçu pour une utilisation dans des environnements limités en mémoire ou en calcul. Il démontre des performances impressionnantes dans des tâches nécessitant un raisonnement approfondi, telles que la génération de code, la résolution de problèmes mathématiques et les requêtes basées sur la logique. Malgré sa taille compacte, il dépasse dans le benchmark RepoQA d'autres modèles de sa catégorie, comme le Llama-3.1-8B-instruct, notamment pour les tâches nécessitant une compréhension de contextes longs.

Das Phi-3.5 MoE (Mixture of Experts) Modell ist das erste seiner Art in Microsofts Portfolio. Es kombiniert verschiedene Modelltypen, die jeweils auf unterschiedliche Aufgaben spezialisiert sind, und kann somit komplexe KI-Aufgaben effizient bewältigen. Mit 42 Milliarden aktiven Parametern bietet es skalierbare Leistungen und unterstützt Kontexte mit bis zu 128.000 Tokens. Es übertrifft beeindruckend GPT-4o mini im 5-shot MMLU-Benchmark in Bereichen wie STEM, Geisteswissenschaften und Sozialwissenschaften, was seine Vielseitigkeit und Leistungsfähigkeit unterstreicht.

---

Le modèle Phi-3.5 MoE (Mixture of Experts) est le premier de son genre dans le portefeuille de Microsoft. Il combine différents types de modèles, chacun spécialisé dans des tâches distinctes, permettant ainsi de résoudre efficacement des tâches complexes d'IA. Avec 42 milliards de paramètres actifs, il offre des performances évolutives et supporte des contextes allant jusqu'à 128.000 tokens. Il surpasse de manière impressionnante GPT-4o mini dans le benchmark MMLU 5-shot dans des domaines tels que les STEM, les sciences humaines et sociales, soulignant ainsi sa polyvalence et ses performances.

Le modèle Phi-3.5 Vision Instruct intègre des capacités de traitement de texte et d'image, ce qui le rend idéal pour des tâches telles que le traitement d'image général, la reconnaissance optique de caractères et les résumés vidéo. Avec une prise en charge des longueurs de contexte de 128k jetons, ce modèle peut gérer des tâches visuelles complexes et multi-couches. Microsoft souligne que le modèle a été formé sur une combinaison de jeux de données synthétiques et disponibles publiquement, avec un accent sur les données de haute qualité et nécessitant une capacité de raisonnement élevée.

Tous les trois modèles de la série Phi-3.5 ont été publiés sous licence MIT, soulignant l'engagement de Microsoft envers le soutien de la communauté open-source. Cette licence permet aux développeurs d'utiliser, de modifier et de distribuer librement le logiciel, tout en respectant les exclusions de responsabilité de Microsoft et d'autres détenteurs de droits d'auteur.

La publication des modèles Phi-3.5 représente une avancée significative dans le développement de l'IA multilingue et multimodale. Avec ces modèles, Microsoft offre aux développeurs la possibilité d'intégrer des capacités d'IA de pointe dans leurs applications, favorisant ainsi l'innovation tant dans le domaine commercial que dans celui de la recherche.

Reconnaissez les actions sous-évaluées en un coup d'œil.
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Abonnement pour 2 € / mois

Nouvelles