Microsoft rozširuje svoje portfólio umelej inteligencie o nové Phi-3.5 modely: Veľký krok smerom k výkonným multimodálnym schopnostiam

Eulerpool News 27. 8. 2024, 11:01

Microsoft pokračuje v svojej pôsobivej sérii úspechov v oblasti umelej inteligencie a dnes oznámil vydanie troch nových modelov v sérii Phi-3.5. Tieto modely, ktoré sa vyznačujú pokročilými funkciami multimodality a multilingválnosti, majú za cieľ ďalej revolučne zmeniť trh aplikácií založených na umelej inteligencii. Modely boli sprístupnené na platforme Hugging Face pod Microsoft-licencovanou MIT licenciou a ponúkajú vývojárom po celom svete možnosť slobodne využívať, prispôsobovať a ďalej rozvíjať tieto inovatívne technológie.

Tri modely – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct a Phi-3.5-vision-instruct – pokrývajú širokú škálu aplikácií, od základných až po vysoko komplexné úlohy. Každé model je optimalizované pre špecifické požiadavky, ako napríklad rýchle a presné uvažovanie alebo spracovanie textových a obrazových dát v multimodálnych úlohách.

Phi-3.5 Mini Instruct model, vybavený 3,8 miliardami parametrov, je ľahký model, špeciálne vyvinutý pre použitie v prostrediach s obmedzenou pamäťou alebo výpočtovým výkonom. Ukazuje pôsobivé výkony v úlohách, ktoré vyžadujú silné logické uvažovanie, ako je generovanie kódu, riešenie matematických problémov a logické dotazy. Napriek svojej kompaktnej veľkosti prekonáva na benchmarke RepoQA iné modely svojej triedy, ako je Llama-3.1-8B-instruct, najmä v úlohách, ktoré vyžadujú porozumenie dlhým kontextom.

Phi-3.5 MoE (Mixture of Experts) model je prvé svojho druhu v portfóliu spoločnosti Microsoft. Kombinuje rôzne typy modelov, z ktorých každý je špecializovaný na rôzne úlohy, a tým dokáže efektívne zvládať komplexné úlohy v oblasti AI. S 42 miliardami aktívnych parametrov ponúka škálovateľný výkon a podporuje kontexty až s 128.000 tokenmi. Impresívne prekonáva GPT-4o mini v 5-shot MMLU benchmarku v oblastiach ako STEM, humanitné a spoločenské vedy, čo zdôrazňuje jeho všestrannosť a výkon.

Phi-3.5 Vision Instruct Model integruje schopnosti spracovania textu a obrazov, čo ho robí ideálnym pre úlohy ako všeobecné spracovanie obrazu, optické rozpoznávanie znakov a zhrnutie videí. S podporou pre kontextové dĺžky 128k tokenov dokáže tento model zvládnuť komplexné, viacvrstvové vizuálne úlohy. Microsoft zdôrazňuje, že model bol trénovaný na kombinácii syntetických a verejne dostupných dátových súborov, s dôrazom na vysoko kvalitné a reasoning-intenzívne údaje.

Všetky tri modely série Phi-3.5 boli vydané pod licenciou MIT, čo zdôrazňuje záväzok spoločnosti Microsoft podporovať open-source komunitu. Táto licencia umožňuje vývojárom slobodne používať, modifikovať a šíriť softvér, pričom musia brať ohľad na vylúčenie zodpovednosti spoločnosti Microsoft a ďalších držiteľov autorských práv.

Uvedenie modelov Phi-3.5 predstavuje významný pokrok vo vývoji viacjazyčnej a multimodálnej umelej inteligencie. Vďaka týmto modelom ponúka Microsoft vývojárom možnosť integrovať špičkové schopnosti umelej inteligencie do svojich aplikácií, čo podporuje inovácie v komerčnej aj výskumnej oblasti.

Microsoft rozširuje svoje portfólio umelej inteligencie o nové Phi-3.5 modely: Veľký krok smerom k výkonným multimodálnym schopnostiam

Urob najlepšie investície svojho života

Novinky

Čínski logistici výrazne zvyšujú prenájmy skladov v USA.

OPEC+ predlžuje zníženie ťažby – ceny ropy stúpajú o viac ako 2 %.

KPMG prepúšťa 330 zamestnancov v americkom audítorskom oddelení napriek rastu tržieb.

Xiaomi útočí s luxusným elektrošportiakom SU7 Ultra na Teslu

Zriedkavé včely zastavujú Metove plány na jadrové AI výpočtové centrum.