Microsoft kontynuuje swoją imponującą serię sukcesów w dziedzinie sztucznej inteligencji ogłaszając dzisiaj wydanie trzech nowych modeli z serii Phi-3.5.
Trzy modele – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct i Phi-3.5-vision-instruct – obejmują szeroki zakres zastosowań, od podstawowych do wysoko zaawansowanych zadań. Każdy model jest zoptymalizowany pod kątem specyficznych wymagań, takich jak szybkie i precyzyjne rozumowanie lub przetwarzanie danych tekstowych i obrazowych w zadaniach multimodalnych.
Model Phi-3.5 Mini Instruct, wyposażony w 3,8 miliarda parametrów, to lekkie model specjalnie zaprojektowane do użytku w środowiskach o ograniczonej pamięci lub mocy obliczeniowej. Wykazuje imponujące osiągi w zadaniach wymagających silnego rozumowania, takich jak generowanie kodu, rozwiązywanie problemów matematycznych i zapytania oparte na logice. Pomimo swojej kompaktowej wielkości przewyższa na benchmarku RepoQA inne modele w swojej klasie, takie jak Llama-3.1-8B-instruct, zwłaszcza w zadaniach wymagających zrozumienia długich kontekstów.
Phi-3.5 MoE (Mixture of Experts) Model jest pierwszym tego typu w portfolio Microsoft.
Phi-3.5 Vision Instruct Model integruje umiejętności przetwarzania tekstu i obrazu, co czyni go idealnym do zadań takich jak ogólne przetwarzanie obrazów, optyczne rozpoznawanie znaków i streszczenia wideo. Dzięki obsłudze kontekstów o długości 128k tokenów, model ten może radzić sobie ze skomplikowanymi, wielowarstwowymi zadaniami wizualnymi. Microsoft podkreśla, że model został wytrenowany na połączeniu syntetycznych i publicznie dostępnych zbiorów danych, z naciskiem na dane wysokiej jakości i wymagające intensywnego rozumowania.
Wszystkie trzy modele z serii Phi-3.5 zostały wydane na licencji MIT, co podkreśla zaangażowanie Microsoftu w wspieranie społeczności Open Source. Ta licencja pozwala programistom na swobodne użytkowanie, modyfikowanie i dystrybucję oprogramowania, z jednoczesnym przestrzeganiem wyłączeń odpowiedzialności Microsoftu i innych posiadaczy praw autorskich.
Publikacja modeli Phi-3.5 stanowi znaczący postęp w rozwoju multijęzycznej i multimodalnej sztucznej inteligencji. Dzięki tym modelom Microsoft oferuje deweloperom możliwość integrowania nowoczesnych możliwości sztucznej inteligencji w ich aplikacjach, co sprzyja innowacjom zarówno w sektorze komercyjnym, jak i badawczym.