AI
マイクロソフトが新しいPhi-3.5モデルでAIポートフォリオを拡大:高性能なマルチモーダル対応に向けた大きな一歩
マイクロソフトは、AI開発のトップポジションに向けた重要な進展を記すPhi-3.5シリーズの新しいモデルを3つ発表しました。
マイクロソフトは人工知能分野での印象的な成功を続けており、本日Phi-3.5シリーズの3つの新しいモデルのリリースを発表しました。これらのモデルは高度なマルチモーダルおよびマルチリンガル機能を特徴としており、AIベースのアプリケーション市場をさらに革命化することを目指しています。このモデルはMicrosoftブランドのMITライセンスの下でHugging Faceに提供され、世界中の開発者にこれらの革新的な技術を自由に使用、カスタマイズ、および開発する機会を提供しています。
3つのモデル – Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct、Phi-3.5-vision-instruct – は、基本的なものから高度に複雑なタスクに至るまで広範囲な応用をカバーしています。各モデルは、迅速かつ正確な推論や、テキストおよび画像データのマルチモーダルタスクにおける処理など、特定の要件に最適化されています。
Phi-3.5 Mini Instructモデル、3.8億パラメーターを搭載した軽量モデルは、メモリや計算能力に制約のある環境での使用を目的に特別に設計されました。このモデルは、コード生成、数学的問題解決、論理に基づく問いかけなど、高度な推論を必要とするタスクで優れたパフォーマンスを発揮します。そのコンパクトなサイズにもかかわらず、長い文脈の理解を必要とするタスクにおいて、同クラスモデルであるLlama-3.1-8B-instructを含む他のモデルをRepoQAベンチマークで上回ります。
マイクロソフトのポートフォリオで初の「Phi-3.5 MoE (Mixture of Experts) モデル」。これにより複雑なAIタスクを効率的に処理可能。
以下の見出しを日本語に翻訳します:
Phi-3.5ヴィジョン指示モデルは、テキストおよび画像処理機能を統合しているため、一般的な画像処理、光学文字認識、およびビデオ要約などのタスクに理想的です。このモデルは128kトークンコンテキスト長をサポートしており、複雑で多層的な視覚タスクにも対応できることができます。マイクロソフトは、このモデルが合成データと公開データセットの組み合わせで訓練されており、高品質で推論を強く求めるデータに焦点を当てていることを強調しています。
すべてのPhi-3.5シリーズモデルはMITライセンスのもとで公開され、これはオープンソースコミュニティを支援するMicrosoftの取り組みを強調しています。このライセンスは、開発者がソフトウェアを自由に利用、改変、配布できることを可能にし、同時にMicrosoftおよび他の著作権者の免責事項に従うことを求めています。
Phi-3.5モデルの発表は、多言語および多モーダルAIの開発における重要な前進です。これらのモデルにより、Microsoftは開発者に最先端のAI能力をアプリケーションに統合する機会を提供し、商業および研究分野の両方での革新を促進します。