San Francisco-baserede OpenAI præsenterede mandag den nye generative AI-model GPT-4o. "o'et" står for "omni" og refererer til modellens evne til at behandle tekst, tale og video. GPT-4o vil gradvist blive implementeret i virksomhedens udvikler- og slutbrugerprodukter i de kommende uger.
OpenAI-CTO Mira Murati forklarede, at GPT-4o har GPT-4's intelligens, men forbedrer evnerne inden for flere modaliteter og medier. "GPT-4o kan tænke ud over sprog, tekst og vision," sagde Murati under en præsentation på OpenAI's kontorer. "Dette er af stor betydning, da vi former fremtiden for interaktion mellem mennesker og maskiner."
Den forrige model, GPT-4 Turbo, var designet til at analysere billeder og tekst. GPT-4o udvider disse evner med sprog. Dette muliggør en række nye anvendelser, herunder en forbedret brugeroplevelse i AI-understøttet chatbot ChatGPT.
Med GPT-4 bliver ChatGPT mere brugervenlig, da brugere nu kan stille spørgsmål og afbryde ChatGPT under svaret. Modellen reagerer i realtid og kan endda genkende nuancer i en brugers stemme og svare i overensstemmelse hermed i forskellige følelsesmæssige stilarter, inklusive sang.
GPT-4 forbedrer ChatGPT's visuelle evner. Modellen kan nu svare på spørgsmål om et foto eller en skærm, for eksempel "Hvad sker der i denne softwarekode?" eller "Hvilket mærke er denne skjorte?"
Disse funktioner skal ifølge Murati videreudvikles. Fremover kunne GPT-4o ChatGPT muliggøre, for eksempel, at "se" en live sportskamp og forklare reglerne.
GPT-4o er også flersproget og viser ifølge OpenAI forbedret ydelse på omkring 50 sprog. I OpenAI-API'en og Microsofts Azure OpenAI-tjeneste er GPT-4o dobbelt så hurtig, halvt så dyr og har højere rategrænser end GPT-4 Turbo.
Den aktuelle sprogfunktionalitet for GPT-4 er endnu ikke tilgængelig for alle kunder i API'en. OpenAI planlægger at tilbyde de nye lydekapaciteter til en lille gruppe af pålidelige partnere først.
GPT-4o er tilgængelig fra i dag i den gratis version af ChatGPT og for abonnenter af premium-planerne ChatGPT Plus og Team med "5 gange højere" beskedgrænser. Den forbedrede ChatGPT-sprogoplevelse vil være tilgængelig i en alpha-version for Plus-brugere i de kommende måneder.
Desuden har OpenAI annonceret en revideret ChatGPT-brugergrænseflade på nettet, som tilbyder en "samtaleorienteret" startside og beskedlayout. En desktop-version af ChatGPT til macOS gør det muligt for brugere at stille spørgsmål eller tage og diskutere skærmbilleder ved hjælp af en tastaturgenvej. ChatGPT Plus-brugere får adgang til appen fra i dag, og en Windows-version vil følge senere på året.
GPT Store, OpenAIs bibliotek og værktøj til oprettelse af tredjeparts-chatbots, er nu også tilgængelig for brugere af den gratis ChatGPT-version. Gratis brugere har nu også adgang til funktioner, der tidligere var bag en betalingsmur, såsom en hukommelsesfunktion, der gør det muligt for ChatGPT at gemme præferencer til fremtidige interaktioner, oploade filer og fotos, samt søge på nettet efter svar på aktuelle spørgsmål.