DeepSeek V3: מודל בינה מלאכותית עם משבר זהות?

  • חוסר שקיפות בנתוני האימון מעלה שאלות לגבי זהות המודל.
  • DeepSeek V3 מזוהה בטעות כ-ChatGPT של OpenAI.

Eulerpool News·

השבוע עורר מעבדת הבינה המלאכותית הסינית DeepSeek תשומת לב כשהציגה את המודל החדש שלה, DeepSeek V3. החברה הממומנת היטב טוענת שמודל זה מוביל ביצועים גבוהים יותר מאשר המתחרים במבחני הביצוע הנפוצים בשוק. במקביל, המודל נותר יעיל ומבצע מטלות טקסט פשוטות כמו כתיבת מאמרים או תכנות בצורה מעוררת רושם. אף על פי כן, DeepSeek V3 מעורר שאלות מסוימות. על פי דיווחים ברשתות החברתיות, שאושרו במבחנים של TechCrunch, המודל מאמין שהוא ChatGPT של OpenAI. כאשר נשאל ביתר פרטים, הוא מזהה את עצמו כגרסה של GPT-4 של OpenAI, שפורסמה ביוני 2023. באופן מפתיע, המודל מספק הנחיות לשימוש ב-API של OpenAI ומשתף את אותם בדיחות כמו GPT-4. הסיבה לכך שהמודל סבור שהוא למעשה ChatGPT נשארת לא ברורה. מערכות סטטיסטיות כמו DeepSeek V3 לומדות ממיליוני דוגמאות לצורך הסקת תחזיות מבוססות נתונים אלה. חוסר שקיפות לגבי נתוני ההכשרה של המודל מקשה על מתן הסברים נוספים. עם זאת, קיימים רבים מערכי נתונים ציבוריים המכילים טקסטים שנוצרו על ידי ChatGPT, וייתכן ש-DeepSeek V3 למד חלק מהתשובות הללו בעל-פה. מייק קוק, חוקר בקינג'ס קולג' לונדון עם התמחות בבינה מלאכותית, ציין כי זה אמנם יכול לקרות "במקרה" שהמודל מדמה את ChatGPT, אך מקרים דומים התרחשו בעבר. במצבים כאלה, ידע של מודלים מתחרים נלקח ישירות, מה שמשפיע לשלילה על איכות המודל. דבר זה מוביל לשגיאות ותשובות שגויות, שכן הקשר עם המציאות אובד, בדומה להעתקים ההולכים ומתעמעמים של מכונת צילום.
Eulerpool Data & Analytics

Modern Financial Markets Data
Better  · Faster  · Cheaper

The highest-quality data scrubbed, verified and continually updated.

  • 10m securities worldwide: equities, ETFs, bonds
  • 100 % realtime data: 100k+ updates/day
  • Full 50-year history and 10-year estimates
  • World's leading ESG data w/ 50 billion stats
  • Europe's #1 news agency w/ 10.000+ sources

Get in touch

Save up to 68 % compared to legacy data vendors