Microsoft vydal další verzi svého lehkého modelu umělé inteligence, Phi-3 Mini. Tento model, první z řady menších modelů, obsahuje 3,8 miliardy parametrů a je tak speciálně optimalizován pro použití na osobních zařízeních jako jsou smartphony a laptopy. Ve srovnání s většími jazykovými modely jako je GPT-4, je Phi-3 Mini trénován na menším datasetu a je nyní dostupný na platformách jako Azure, Hugging Face a Ollama.
Eric Boyd, viceprezident korporátní divize Microsoft Azure AI, vysvětluje, že Phi-3 Mini je podobně výkonný jako větší jazykové modely typu GPT-3.5, avšak v kompaktnějším formátu. Menší velikost vede k nižším provozním nákladům a zlepšenému výkonu na koncových zařízeních.
Microsoft plánuje rovněž představit další modely této řady, včetně Phi-3 Small s 7 miliardami parametrů a Phi-3 Medium s 14 miliardami parametrů. Vývoj těchto modelů je součástí firemní strategie zaměřené na efektivnější, šetrnější KI modely, které byly speciálně vytvořeny pro méně komplexní úkoly, jako je shrnování dokumentů nebo podpora programování.
Metody tréninku pro Phi-3 jsou inspirovány pedagogickými přístupy. Vývojáři použili učební plán založený na zjednodušených textech, podobných příběhům, které se čtou dětem. Tato metoda pomáhá modelu rychleji zachytit základní koncepty a struktury. Podle Boyda byl trénink podpořen "dětskými knihami", které vytvořil jiný LLM, aby systematicky školil Phi-3.
Přes schopnost zlepšovat komplexní úlohy, jako je programování a logické uvažování, nemůže Phi-3 Mini dosáhnout šíři znalostí větších modelů, jako je GPT-4. Nicméně představuje pro mnoho firem využívajících menší, specifické datové sady, cenově efektivní a výkonnou alternativu.
S touto nejnovější vývojovou fází Microsoft nadále sází na inovace v oblasti umělé inteligence, přičemž klade důraz na praktickou aplikovatelnost a efektivitu. To zdůrazňuje Microsoftovu ambici zůstat lídrem ve vývoji řešení AI, která jsou jak výkonná, tak přístupná.