Microsoft tiếp tục chuỗi thành công ấn tượng trong lĩnh vực trí tuệ nhân tạo và hôm nay đã công bố phát hành ba mô hình mới trong dòng Phi-3.5. Những mô hình này, nổi bật với các chức năng đa phương thức và đa ngôn ngữ tiên tiến, nhằm mục đích tiếp tục cách mạng hóa thị trường ứng dụng dựa trên AI. Các mô hình đã được cung cấp trên Hugging Face dưới giấy phép MIT gắn thương hiệu Microsoft, cho phép các nhà phát triển trên toàn thế giới tự do sử dụng, điều chỉnh và phát triển các công nghệ tiên tiến này.
Ba mô hình – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct và Phi-3.5-vision-instruct – bao phủ một loạt các ứng dụng, từ nhiệm vụ cơ bản đến phức tạp cao. Mỗi mô hình được tối ưu hóa cho các yêu cầu cụ thể, chẳng hạn như lý luận nhanh và chính xác hoặc xử lý dữ liệu văn bản và hình ảnh trong các nhiệm vụ đa phương thức.
Das Phi-3.5 Mini Instruct Modell, ausgestattet mit 3,8 Milliarden Parametern, ist ein leichtgewichtiges Modell, das speziell für den Einsatz in speicher- oder rechenbeschränkten Umgebungen entwickelt wurde. Es zeigt beeindruckende Leistungen in Aufgaben, die starkes Reasoning erfordern, wie etwa Code-Generierung, mathematische Problemlösungen und logikbasierte Abfragen. Trotz seiner kompakten Größe übertrifft es auf dem RepoQA-Benchmark andere Modelle seiner Klasse, wie das Llama-3.1-8B-instruct, insbesondere bei Aufgaben, die ein Verständnis von langen Kontexten erfordern.
Phi-3.5 Mini Instruct Model, được trang bị 3,8 tỷ tham số, là một mô hình nhẹ, được phát triển đặc biệt cho những môi trường hạn chế về bộ nhớ hoặc tính toán. Nó cho thấy hiệu suất ấn tượng trong các nhiệm vụ đòi hỏi lý luận mạnh mẽ, như tạo mã, giải bài toán toán học và truy vấn dựa trên logic. Mặc dù kích thước nhỏ gọn, nó vượt trội so với các mô hình khác cùng loại trong benchmark RepoQA, như Llama-3.1-8B-instruct, đặc biệt trong các nhiệm vụ yêu cầu hiểu biết về ngữ cảnh dài.
Das Phi-3.5 MoE (Mixture of Experts) Modell ist das erste seiner Art in Microsofts Portfolio. Es kombiniert verschiedene Modelltypen, die jeweils auf unterschiedliche Aufgaben spezialisiert sind, und kann somit komplexe KI-Aufgaben effizient bewältigen. Mit 42 Milliarden aktiven Parametern bietet es skalierbare Leistungen und unterstützt Kontexte mit bis zu 128.000 Tokens. Es übertrifft beeindruckend GPT-4o mini im 5-shot MMLU-Benchmark in Bereichen wie STEM, Geisteswissenschaften und Sozialwissenschaften, was seine Vielseitigkeit und Leistungsfähigkeit unterstreicht.
Mô hình Phi-3.5 MoE (Mixture of Experts) là mô hình đầu tiên thuộc loại này trong danh mục đầu tư của Microsoft. Nó kết hợp các loại mô hình khác nhau, mỗi loại chuyên về các nhiệm vụ khác nhau, và do đó có thể giải quyết hiệu quả các nhiệm vụ AI phức tạp. Với 42 tỷ tham số hoạt động, nó cung cấp hiệu suất có thể mở rộng và hỗ trợ các ngữ cảnh với tối đa 128.000 tokens. Nó vượt trội hơn GPT-40 mini trong chuẩn 5-shot MMLU ở các lĩnh vực như STEM, Nhân văn học và Khoa học xã hội, điều này nhấn mạnh sự linh hoạt và khả năng mạnh mẽ của nó.
Phiên bản mô hình hướng dẫn Phi-3.5 tích hợp khả năng xử lý văn bản và hình ảnh, làm cho nó trở nên lý tưởng cho các nhiệm vụ như xử lý hình ảnh chung, nhận dạng ký tự quang học và tóm tắt video. Với hỗ trợ cho độ dài ngữ cảnh lên đến 128k token, mô hình này có thể giải quyết các nhiệm vụ hình ảnh phức tạp, đa lớp. Microsoft nhấn mạnh rằng mô hình được huấn luyện trên sự kết hợp giữa dữ liệu tổng hợp và dữ liệu công khai, với trọng tâm là dữ liệu chất lượng cao và đòi hỏi khả năng lập luận cao.
Tất cả ba mô hình trong dòng Phi-3.5 đã được phát hành theo giấy phép MIT, điều này nhấn mạnh cam kết của Microsoft trong việc hỗ trợ cộng đồng mã nguồn mở. Giấy phép này cho phép các nhà phát triển tự do sử dụng, sửa đổi và phân phối phần mềm, đồng thời phải tuân theo các điều khoản miễn trừ trách nhiệm pháp lý của Microsoft và các chủ sở hữu bản quyền khác.
Việc phát hành các mô hình Phi-3.5 là một bước tiến quan trọng trong sự phát triển của AI đa ngôn ngữ và đa phương thức. Với các mô hình này, Microsoft cung cấp cho các nhà phát triển khả năng tích hợp các tính năng AI tiên tiến vào ứng dụng của họ, thúc đẩy đổi mới cả trong lĩnh vực thương mại và nghiên cứu.