Microsoft jätkab oma muljetavaldavat edulugu tehisintellekti valdkonnas ning on täna teatanud kolme uue mudeli avaldamisest Phi-3.5-seerias. Need mudelid, mis paistavad silma arenenud multimodaalsuse ja mitmekeelsuse funktsioonidega, on loodud jätkuvalt revolutsioneerima KI-põhiste rakenduste turgu. Mudelid on saadaval Hugging Face platvormil Microsofti-bränditud MIT-litsentsi all ja pakuvad arendajatele üle kogu maailma võimalust neid uuenduslikke tehnoloogiaid vabalt kasutada, kohandada ja edasi arendada.
Kolm mudelit – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct ja Phi-3.5-vision-instruct – katavad laia valikut rakendusi, alates põhitegevustest kuni kõrge keerukusega ülesanneteni. Iga mudel on optimeeritud konkreetsete nõuete jaoks, nagu näiteks kiire ja täpne mõtlemine või teksti- ja pildandmete töötlemine multimodaalsustes ülesannetes.
Das Phi-3.5 Mini Instruct Modell, ausgestattet mit 3,8 Milliarden Parametern, ist ein leichtgewichtiges Modell, das speziell für den Einsatz in speicher- oder rechenbeschränkten Umgebungen entwickelt wurde. Es zeigt beeindruckende Leistungen in Aufgaben, die starkes Reasoning erfordern, wie etwa Code-Generierung, mathematische Problemlösungen und logikbasierte Abfragen. Trotz seiner kompakten Größe übertrifft es auf dem RepoQA-Benchmark andere Modelle seiner Klasse, wie das Llama-3.1-8B-instruct, insbesondere bei Aufgaben, die ein Verständnis von langen Kontexten erfordern.
Phi-3.5 Mini Instruct mudel, millel on 3,8 miljardit parameetrit, on kergekaaluline mudel, mis on spetsiaalselt loodud kasutamiseks mälumahu või arvutusvõimsuse piirangutega keskkondades. See näitab muljetavaldavat sooritust ülesannetes, mis nõuavad tugevat arutlusvõimet, nagu koodi genereerimine, matemaatiliste probleemide lahendamine ja loogikapõhised päringud. Vaatamata oma kompaktsusele edestab see RepoQA võrdlusalusel oma klassi muid mudeleid, näiteks Llama-3.1-8B-instruct, eriti ülesannetes, mis nõuavad pika konteksti mõistmist.
Phi-3.5 MoE (Mixture of Experts) mudel on esimene omalaadne Microsofti portfellis. See ühendab erinevat tüüpi mudeleid, millest igaüks on spetsialiseerunud erinevatele ülesannetele, ja suudab seega tõhusalt lahendada keerulisi tehisintellekti ülesandeid. 42 miljardi aktiivse parameetriga pakub see mastaapselt jõudlust ja toetab kontekste kuni 128 000 tokenini. See ületab muljetavaldavalt GPT-4o mini 5-shot MMLU-võrdlusalusel sellistes valdkondades nagu STEM, humanitaar- ja sotsiaalteadused, mis rõhutab selle mitmekülgsust ja võimekust.
Phi-3.5 Vision õpetuse mudel ühendab teksti- ja pilditöötlusvõimeid, muutes selle ideaalseks ülesannete jaoks, nagu üldine pilditöötlus, optiline märkide tuvastamine ja videokokkuvõtted. 128k tokeni kontekstipikkuse toetamisega suudab see mudel keerukaid, mitmekihilisi visuaalseid ülesandeid lahendada. Microsoft rõhutab, et mudel on treenitud sünteetiliste ja avalikult kättesaadavate andmekogumite kombinatsioonil, keskendudes kvaliteetsetele ja loogilist mõtlemist nõudvatele andmetele.
Kõik Phi-3.5-seeria kolm mudelit avaldati MIT-litsentsi all, mis rõhutab Microsofti pühendumust avatud lähtekoodiga kogukonna toetamisele. See litsents võimaldab arendajatel tarkvara vabalt kasutada, muuta ja levitada, jälgides samal ajal Microsofti ja teiste autoriõiguse omanike vastutuse välistusi.
Phi-3.5 mudelite avaldamine tähistab olulist edasiminekut multilingvaalse ja multimodaalse tehisintellekti arendamisel. Nende mudelite abil võimaldab Microsoft arendajatel integreerida oma rakendustesse tipptasemel tehisintellekti võimekusi, edendades seeläbi innovatsiooni nii kaubanduslikus kui ka teadusuuringute valdkonnas.