OpenAI öffnet Türen für Stimme-gestützte Anwendungen

  • OpenAI bietet Echtzeit-Sprachassistenten über API an.
  • Erste Unternehmen testen die neue Sprachfunktion bereits.

Eulerpool News·

OpenAI ermöglicht es nun Unternehmen und Entwicklern, seinen Echtzeit-Sprachassistenten in deren eigenen Anwendungen zu integrieren. Dies ebnet den Weg für eine breitere Nutzung von realistisch klingenden, auf künstlicher Intelligenz basierenden Sprachinteraktionen für vielfältige Aufgaben. Das neue Feature, ähnlich dem neuesten Sprachassistenten der bezahlten Benutzer des ChatGPT-Chatbots, wird ab Dienstag für jene verfügbar sein, die Apps und Dienste mit OpenAIs Programmierschnittstelle (API) entwickeln. Unternehmen können somit Softwarelösungen entwickeln, wie etwa sprachbasierte Kundendienst-Bots oder Reise-Apps, die im Auftrag des Nutzers Anrufe tätigen. Erste Unternehmen testen diese neue Sprachfunktion bereits, darunter die Gesundheits-Coaching-App Healthify und die Sprachlern-App Speak. Diese Erweiterung ist Teil mehrerer Updates, die OpenAI bei einem Entwickler-Event in San Francisco am Dienstag bekannt gibt. Die Konferenz bietet OpenAI die Gelegenheit, seine Strategie zur Behauptung in einem zunehmend umkämpften Markt für KI-Software zu präsentieren, während das Unternehmen eine große Finanzierungsrunde abschließen möchte. Dies geschieht kurz nachdem mehrere Führungskräfte, einschließlich der Chief Technology Officer Mira Murati, ihren Abgang von der Start-up-Schmiede angekündigt haben – die jüngsten unter einer Reihe hochrangiger Abgänge in den letzten Monaten. Während OpenAI bei seiner ersten Entwicklerkonferenz letzten November ein neues KI-Modell vorstellte, wird dies in diesem Jahr nicht der Fall sein. Stattdessen konzentriert sich OpenAI darauf, neue API-Funktionen zu präsentieren und sich mit einigen der mehr als 3 Millionen Entwickler weltweit auszutauschen, die mit ihrer Software arbeiten. Die Veranstaltung am Dienstag ist die erste von drei geplanten Veranstaltungen, die weiteren werden in London und Singapur stattfinden. In einer Pressevorführung vor der Veranstaltung demonstrierten OpenAI-Mitarbeiter die neue Sprachfunktion mit einer fiktiven Reise-App. Romain Huet, Leiter der Entwicklererfahrung bei OpenAI, bat die fiktive App, bei einem erfundenen Unternehmen namens "Ilan's Strawberries" 400 schokoladenüberzogene Erdbeeren zu bestellen und das Budget von $1.500 nicht zu überschreiten. Sofort tätigte die App einen Anruf – eine Funktion, die durch die Nutzung einer API des Cloud-Kommunikationsunternehmens Twilio ermöglicht wurde – und ein Telefon neben Huet klingelte. Huet nahm den Hörer ab und spielte den Mitarbeiter des Erdbeer-Unternehmens, der die Bestellung des Sprachassistenten für etwa $1.200 entgegennahm.
EULERPOOL DATA & ANALYTICS

Make smarter decisions faster with the world's premier financial data

Eulerpool Data & Analytics