Microsoft proširuje svoj AI-portfelj s novim Phi-3.5 modelima: Veliki korak prema snažnoj multimodalnosti

27. 08. 2024. 11:01

Microsoft je predstavio tri nova modela serije Phi-3.5, koja označavaju značajan napredak na putu ka vrhunskoj poziciji u razvoju umjetne inteligencije.

Eulerpool News 27. kol 2024. 11:01

Microsoft nastavlja svoju impresivnu seriju uspjeha u području umjetne inteligencije i danas je najavio objavu tri nova modela iz serije Phi-3.5. Ovi modeli, koji se odlikuju naprednim funkcijama multimodalnosti i višejezičnosti, imaju za cilj daljnju revoluciju tržišta aplikacija temeljenih na umjetnoj inteligenciji. Modeli su dostupni na platformi Hugging Face pod MIT licencom s Microsoftovim brandom, omogućujući razvijateljima širom svijeta slobodno korištenje, prilagodbu i daljnji razvoj ovih inovativnih tehnologija.

Tri modela – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct i Phi-3.5-vision-instruct – pokrivaju širok spektar primjena, od osnovnih do vrlo složenih zadataka. Svaki je model optimiziran za specifične zahtjeve, kao što su brzo i precizno zaključivanje ili obrada tekstualnih i slikovnih podataka u zadacima multimodalnosti.

Phi-3.5 Mini Instruct model, opremljen s 3,8 milijardi parametara, lagan je model razvijen posebno za korištenje u okruženjima s ograničenim memorijskim ili računalnim resursima. Pokazuje impresivne rezultate u zadacima koji zahtijevaju snažno rezoniranje, kao što su generiranje koda, rješavanje matematičkih problema i logičke upite. Unatoč svojoj kompaktnoj veličini, nadmašuje druge modele svoje klase na RepoQA benchmarku, poput Llama-3.1-8B-instruct, posebno u zadacima koji zahtijevaju razumijevanje dugih konteksta.

Das Phi-3.5 MoE (Mixture of Experts) Modell ist das erste seiner Art in Microsofts Portfolio.

Phi-3.5 MoE (Mixture of Experts) model je prvo takve vrste u portfelju Microsofta.

Das Phi-3.5 Vision Instruct Modell integriert Text- und Bildverarbeitungsfähigkeiten, was es ideal für Aufgaben wie allgemeine Bildverarbeitung, optische Zeichenerkennung und Videozusammenfassungen macht. Mit einer Unterstützung für 128k Token-Kontextlängen kann dieses Modell komplexe, mehrschichtige visuelle Aufgaben bewältigen. Microsoft betont, dass das Modell auf einer Kombination aus synthetischen und öffentlich verfügbaren Datensätzen trainiert wurde, wobei der Fokus auf qualitativ hochwertigen und reasoning-intensiven Daten lag.

Croatian Translation:
Phi-3.5 Vision Instruct model integrira sposobnosti obrade teksta i slika, što ga čini idealnim za zadatke poput opće obrade slika, optičkog prepoznavanja znakova i sažimanja videozapisa. Sa podrškom za kontekstne duljine od 128k tokena, ovaj model može svladati složene, višeslojne vizualne zadatke. Microsoft naglašava da je model treniran na kombinaciji sintetičkih i javno dostupnih skupova podataka, s naglaskom na kvalitetnim podacima koji zahtijevaju intenzivno razmišljanje.

Sva tri modela serije Phi-3.5 objavljena su pod MIT licencom, što naglašava Microsoftovu predanost podršci open-source zajednici. Ova licenca omogućuje programerima slobodno korištenje, modificiranje i distribuciju softvera, uz obvezu pridržavanja odricanja odgovornosti Microsofta i drugih vlasnika autorskih prava.

Objava Phi-3.5 modela predstavlja značajan napredak u razvoju višejezične i multimodalne umjetne inteligencije. Ovi modeli omogućuju Microsoftovim developerima integraciju naprednih AI sposobnosti u svoje aplikacije, potičući inovacije u komercijalnom i istraživačkom području.

Učini najbolje investicije svog života
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Od 2 eura osigurajте

Novosti