Gladia: Die Zukunft der Sprachtranskription mit innovativer API

  • Gladia hebt sich im Markt für Sprachtranskription durch innovative API und hohe Genauigkeit hervor.
  • Das Startup hat 16 Millionen US-Dollar in einer Serie-A-Finanzierungsrunde eingesammelt.

Eulerpool News·

Gladia, ein französisches Startup, das eine innovative Programmierschnittstelle (API) für Sprachtranskription anbietet, hat kürzlich 16 Millionen US-Dollar in einer Serie-A-Finanzierungsrunde eingesammelt. Das Unternehmen punktet mit einer herausragenden Genauigkeit und kurzen Bearbeitungszeiten, indem es Audioinhalte präzise in Text umwandelt. In einem Markt, in dem Giganten wie Amazon, Microsoft und Google zwar ähnliche APIs im Portfolio haben, aber nicht an die Leistungen spezialisierter Startups herankommen, hat Gladia sich durchgesetzt. Die beeindruckende Entwicklung im Bereich der Sprachmodelle wird besonders nach der Veröffentlichung von OpenAIs Whisper deutlich. Gladia konkurriert mit anderen gut finanzierten Playern wie AssemblyAI, Deepgram und Speechmatics. Gladia bietet eine verfeinerte Version des Whisper-Modells an, die unter anderem die Fähigkeit zur automatischen Sprechertrennung beinhaltet. Diese Funktion ermöglicht es, Gespräche zu analysieren und transkribieren, indem Sprecherwechsel erkannt werden. Mit einer Unterstützung von 100 Sprachen und zahlreichen Akzenten hat das Startup seine Praxistauglichkeit bewiesen, selbst unter anspruchsvollen Bedingungen. Die API von Gladia wird derzeit von über 600 Unternehmen genutzt, darunter Meeting-Protokollierungsdienste und Notiz-Assistenten wie Attention, Circleback, Method Financial, Recall, Sana und Veed.io. Dank der neuen Finanzierung plant Gladia, den Workflow für Anwender weiter zu optimieren, indem Audiointelligenz und Aufgaben auf Basis von großen Sprachmodellen in einem API-Aufruf integriert werden. Ein weiteres zentrales Problem, das Gladia angehen will, ist die Latenz. Die Echtzeitverarbeitung erfordert extrem niedrige Latenzzeiten, um menschnahe Konversationen zu ermöglichen. Gladia kann derzeit Live-Gespräche mit einer Latenzzeit von unter 300 Millisekunden transkribieren. Ziel ist es, die hohe Qualität der Batch-Verarbeitung mit den Echtzeitfähigkeiten zu verbinden. Dieses Potenzial könnte insbesondere in Callcentern einen wertvollen Beitrag leisten, indem relevante Informationen in Echtzeit bereitgestellt werden. Die API von Gladia ist mit allen gängigen Technologiestacks und Protokollen, einschließlich SIP, VoIP, FreeSwitch und Asterisk, kompatibel. Die Finanzierungsrunde wird von XAnge angeführt, unterstützt von Investoren wie Illuminate Financial, XTX Ventures, Athletico Ventures, Gaingels, Mana Ventures, Motier Ventures, Roosh Ventures und Soma Capital. Gladia ist überzeugt, dass wir an einem entscheidenden Punkt für Audioanwendungen stehen. Die Integration von Transkriptionsmodellen in Betriebssysteme wie iOS und Android könnte den Verbrauchern den Nutzen automatisierter Transkription näherbringen und Entwicklern Anreize bieten, ihre Produkte um Audiofeatures zu erweitern.
EULERPOOL DATA & ANALYTICS

Make smarter decisions faster with the world's premier financial data

Eulerpool Data & Analytics