Microsoft udvider KI-portefølje med nye Phi-3.5-modeller: Et stort skridt mod kraftfuld multimodalitet

Eulerpool News 27. aug. 2024, 11.01

Microsoft fortsætter sin imponerende successerie inden for kunstig intelligens og har i dag annonceret udgivelsen af tre nye modeller i Phi-3.5-serien. Disse modeller, som er kendetegnet ved avancerede multimodalitets- og flersprogede funktioner, har til hensigt at revolutionere markedet for KI-baserede applikationer yderligere. Modellerne er blevet gjort tilgængelige under en Microsoft-brandet MIT-licens på Hugging Face og giver udviklere verden over mulighed for frit at bruge, tilpasse og videreudvikle disse innovative teknologier.

De tre modeller – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct og Phi-3.5-vision-instruct – dækker et bredt spektrum af anvendelser, fra grundlæggende til yderst komplekse opgaver. Hver model er optimeret til specifikke krav, såsom hurtig og præcis ræsonnering eller behandling af tekst- og billeddata i multimodalitetsopgaver.

Das Phi-3.5 Mini Instruct Model, udstyret med 3,8 milliarder parametre, er en letvægtsmodel, der er specielt udviklet til brug i hukommelses- eller beregningsbegrænsede miljøer. Den viser imponerende præstationer i opgaver, der kræver stærk ræsonnering, såsom kodegenerering, matematiske problemløsninger og logikbaserede forespørgsler. På trods af sin kompakte størrelse overgår den andre modeller i sin klasse på RepoQA-benchmark, såsom Llama-3.1-8B-instruct, især ved opgaver, der kræver forståelse af lange sammenhænge.

Phi-3.5 MoE (Mixture of Experts) modellen er den første af sin slags i Microsofts portefølje. Den kombinerer forskellige modeltyper, som hver især er specialiseret i forskellige opgaver, og kan derfor effektivt håndtere komplekse AI-opgaver. Med 42 milliarder aktive parametre tilbyder den skalerbare præstationer og understøtter kontekster med op til 128.000 tokens. Den overgår imponerende GPT-4o mini i 5-shot MMLU-benchmarken inden for områder som STEM, humaniora og samfundsvidenskab, hvilket understreger dens alsidighed og ydeevne.

Phi-3.5 Vision Instruct-modellen integrerer tekst- og billedbehandlingsfunktioner, hvilket gør den ideel til opgaver som generel billedbehandling, optisk tegngenkendelse og videoupdateringer. Med støtte til 128k Token kontekstlængder kan denne model håndtere komplekse, flerlags visuelle opgaver. Microsoft understreger, at modellen er trænet på en kombination af syntetiske og offentligt tilgængelige datasæt med fokus på data af høj kvalitet og intensiv resonnering.

Alle tre modeller i Phi-3.5-serien blev udgivet under en MIT-licens, hvilket understreger Microsofts engagement i at støtte open-source-fællesskabet. Denne licens giver udviklere mulighed for frit at bruge, modificere og distribuere softwaren, samtidig med at de skal overholde Microsofts og andre ophavsretsindehaveres ansvarsfraskrivelser.

Udgivelsen af Phi-3.5-modellerne repræsenterer et betydeligt fremskridt i udviklingen af flersproget og multimodal AI. Med disse modeller tilbyder Microsoft udviklere muligheden for at integrere avancerede AI-færdigheder i deres applikationer, hvilket fremmer innovationer både inden for det kommercielle og forskningsmæssige område.

AI

Microsoft udvider KI-portefølje med nye Phi-3.5-modeller: Et stort skridt mod kraftfuld multimodalitet

Gør de bedste investeringer i dit liv.

Nyheder

Kinesiske logistikfirmaer øger lagerlejemål i USA betydeligt.

OPEC+ forlænger produktionsnedskæringer – oliepriser stiger med over 2 %

KPMG afskediger 330 medarbejdere i amerikansk revisionsafdeling trods omsætningsvækst

Xiaomi angriber Tesla med luksus-elektrisk sportsvogn SU7 Ultra

Sjældne bier stopper Metas planer om atomkraftdrevet KI-datacenter