DeepSeek V3: Ein Künstliche-Intelligenz-Modell mit Identitätskrise?

  • DeepSeek V3 scheint sich fälschlicherweise als ChatGPT von OpenAI zu identifizieren.
  • Mangelnde Transparenz bei den Trainingsdaten wirft Fragen zur Modellidentität auf.

Eulerpool News·

Diese Woche sorgte das chinesische KI-Labor DeepSeek für Aufsehen, als es sein neues Modell DeepSeek V3 vorstellte. Das gut finanzierte Unternehmen behauptet, dass ihr Modell in vielen gängigen Benchmarks erfolgreicher abschneidet als die Konkurrenz. Gleichzeitig bleibt das Modell effizient und bewältigt spielend einfache Textaufgaben wie das Schreiben von Essays oder das Programmieren. Dennoch wirft DeepSeek V3 einige Fragen auf. Laut Berichten auf sozialen Plattformen – und bestätigt durch Tests von TechCrunch – glaubt das Modell, es wäre ChatGPT von OpenAI. Bei weiteren Nachfragen identifiziert sich DeepSeek V3 als eine Version von OpenAIs GPT-4, die im Juni 2023 veröffentlicht wurde. Kurioserweise gibt das Modell Anleitungen zur Nutzung von OpenAIs API und teilt dieselben Witze wie GPT-4. Wieso das Modell meint, es sei tatsächlich ChatGPT, bleibt unklar. Statistische Systeme wie DeepSeek V3 lernen aus Milliarden von Beispielen, um darauf basierend Vorhersagen zu treffen. Ein Mangel an Transparenz bezüglich der Trainingsdaten des Modells erschwert weitere Erklärungen. Allerdings gibt es viele öffentliche Datensätze, die von ChatGPT generierte Texte enthalten, und es wäre möglich, dass DeepSeek V3 einige dieser Antworten auswendig gelernt hat. Mike Cook, ein Forscher am King's College London mit Spezialisierung auf Künstliche Intelligenz, wies darauf hin, dass es zwar „zufällig“ geschehen konnte, dass das Modell ChatGPT imitiert, ähnliche Vorfälle jedoch schon vorgekommen sind. Dabei wird das Wissen konkurrierender Modelle direkt übernommen, was die Modellqualität negativ beeinflusst. Dies führt zu Fehlern und fehlerhaften Antworten, da die Verbindung zur Realität verloren geht – ähnlich einer immer ungenauer werdenden Kopie eines Fotokopierers.
Eulerpool Data & Analytics

Modern Financial Markets Data
Better  · Faster  · Cheaper

The highest-quality data scrubbed, verified and continually updated.

  • 10m securities worldwide: equities, ETFs, bonds
  • 100 % realtime data: 100k+ updates/day
  • Full 50-year history and 10-year estimates
  • World's leading ESG data w/ 50 billion stats
  • Europe's #1 news agency w/ 10.000+ sources

Get in touch

Save up to 68 % compared to legacy data vendors