AI
DeepSeek stawia czoła sankcjom USA: Chiński startup AI zaskakuje wydajnym modelem przy ograniczonym budżecie
DeepSeek przeciwstawia się amerykańskim ograniczeniom eksportowym i zaskakuje modelem AI, który przy ograniczonym budżecie osiąga wysoką wydajność.

DeepSeek, chiński start-up AI na fali wznoszącej, wywołał poruszenie na międzynarodowej scenie technologicznej dzięki wprowadzeniu najnowszego modelu językowego R1. Firma pod kierownictwem miliardera Liang Wenfenga z hedge fundów zaprezentowała szczegółowy przewodnik, jak rozwijać potężny model AI przy ograniczonych zasobach – krok, który mimo sankcji USA dalej napędza chińskie ambicje technologiczne.
Das in Hangzhou ansässige Unternehmen veröffentlichte am Montag eine technische Analyse seines Modells, das auf nur 2.048 Nvidia H800-Chips und mit einem Budget von 5,6 Millionen US-Dollar trainiert wurde.
Zhang Honglin의 DeepSeek는 5,6백만 달러 예산으로 2,048 Nvidia H800-칩만을 사용하여 훈련된 자사 모델에 대한 기술 분석을 월요일에 발표했습니다. 이로써 DeepSeek는 OpenAI와 Google DeepMind와 같은 서구 경쟁업체의 수십억 달러 프로젝트에 대한 비용 효율적인 대안을 만들었습니다.
Hangzhou의 회사는 5 천만 달러 예산으로 2개의 Nvidia H800 칩만을 사용하여 훈련된 자사의 모델에 대한 기술 분석을 월요일에 발표했습니다. DeepSeek는 이에 이어 OpenAI와 Google DeepMind와 같은 비밀 유지 방법을 사용하여 서구 경쟁 업체의 수십억 달러 프로젝트에 대한 비용 효율적인 대안을 만들었습니다.
Liang Wenfeng, pierwotnie handlarz kwantytatywny, zaczął w 2021 roku budować infrastrukturę AI w ramach swojego funduszu hedgingowego High-Flyer. Eksperci z branży początkowo uważali jego ambicje za nierealistyczne. Jednak dzięki zespołowi wysoko wykwalifikowanych inżynierów i dogłębnemu zrozumieniu wykorzystania procesorów graficznych DeepSeek mógł zmaksymalizować wydajność sprzętu.
Po zakazach eksportu zaawansowanych układów scalonych w USA DeepSeek postawił na innowacyjne metody szkoleniowe, które odróżniają firmę od amerykańskich konkurentów. Liang wykorzystuje zyski z funduszu hedgingowego, aby pozyskać wysoko wykwalifikowanych badaczy z czołowych chińskich uniwersytetów i ustanowić czysto chińską strukturę badawczo-rozwojową.
DeepSeek stosuje niekonwencjonalną strategię, ujawniając wyniki badań zamiast chronić je komercyjnie. To przyciąga uwagę branży i zwiększa presję na zachodnich konkurentów. Jednocześnie pozostaje niejasne, czy firma będzie w stanie długoterminowo dotrzymać kroku szybkiemu rozwojowi technologicznemu gigantów z USA, zwłaszcza w obliczu planowanych miliardowych inwestycji OpenAI i SoftBanku w infrastrukturę SI.
Trotz imponujących postępów pozostaje niepewność co do finansowej trwałości. Podczas gdy amerykańskie firmy, takie jak xAI Elona Muska, stawiają na ogromne klastry superkomputerów, DeepSeek w przyszłości może napotkać na bariery wydajności. Ostatnia wydajność funduszu hedgingowego High-Flyer wykazuje już oznaki obciążenia z powodu skupienia Lianga na projekcie AI.