DeepSeek chống lại các lệnh trừng phạt của Mỹ: Startup AI Trung Quốc gây bất ngờ với mô hình hiệu quả trên ngân sách hạn chế

DeepSeek bất chấp các hạn chế xuất khẩu của Mỹ và gây bất ngờ với một mô hình AI, đạt hiệu suất cao mặc dù với ngân sách hạn chế.

16:22 27/1/2025
Eulerpool News 16:22 27 thg 1, 2025

DeepSeek, một startup AI đầy triển vọng của Trung Quốc, đã gây náo động thế giới công nghệ quốc tế với việc phát hành mô hình ngôn ngữ mới nhất của mình, R1. Công ty dưới sự lãnh đạo của tỷ phú quỹ đầu tư Liang Wenfeng đã trình bày một hướng dẫn chi tiết về cách phát triển một mô hình AI mạnh mẽ với nguồn lực hạn chế - một bước tiến thúc đẩy tham vọng công nghệ của Trung Quốc bất chấp các lệnh trừng phạt của Mỹ.

Công ty có trụ sở tại Hàng Châu đã công bố vào thứ Hai một phân tích kỹ thuật về mô hình của mình, được huấn luyện chỉ trên 2.048 chip Nvidia H800 và với ngân sách 5,6 triệu đô la Mỹ. Qua đó, DeepSeek đã tạo ra một giải pháp thay thế tiết kiệm chi phí so với các dự án trị giá hàng tỷ đô la của các đối thủ phương Tây như OpenAI và Google DeepMind, những dự án mà cho đến nay vẫn giữ bí mật phương pháp của họ.

Liang Wenfeng, ban đầu là một nhà giao dịch định lượng, bắt đầu xây dựng một cơ sở hạ tầng AI trong quỹ đầu cơ High-Flyer của mình vào năm 2021. Các chuyên gia trong ngành ban đầu cho rằng tham vọng của ông là không thực tế. Tuy nhiên, với một đội ngũ kỹ sư trình độ cao và sự hiểu biết sâu sắc về việc sử dụng GPU, DeepSeek đã có thể tối đa hóa hiệu suất của phần cứng.

Sau lệnh cấm xuất khẩu chip hiệu suất cao của Mỹ, DeepSeek áp dụng các phương pháp đào tạo sáng tạo, giúp công ty phân biệt với các đối thủ Mỹ. Liang sử dụng lợi nhuận từ quỹ đầu cơ của mình để thu hút các nhà nghiên cứu chất lượng cao từ các trường đại học hàng đầu của Trung Quốc và thiết lập một cấu trúc nghiên cứu và phát triển hoàn toàn của Trung Quốc.

DeepSeek theo đuổi một chiến lược phi truyền thống bằng cách công khai kết quả nghiên cứu thay vì bảo vệ chúng bằng thương mại. Điều này thu hút sự chú ý trong ngành và tăng áp lực lên các đối thủ phương Tây. Đồng thời, vẫn chưa rõ liệu công ty có thể theo kịp sự phát triển công nghệ nhanh chóng của các gã khổng lồ Mỹ trong dài hạn hay không, đặc biệt là trước các khoản đầu tư hàng tỷ dự kiến của OpenAI và SoftBank vào cơ sở hạ tầng AI.

Tuy có những tiến bộ ấn tượng nhưng sự không chắc chắn về khả năng tài chính vẫn tồn tại. Trong khi các công ty Mỹ như xAI của Elon Musk dựa vào cụm siêu máy tính khổng lồ, DeepSeek có thể gặp giới hạn về khả năng trong tương lai. Hiệu suất gần đây của quỹ phòng hộ High-Flyer đã cho thấy dấu hiệu căng thẳng từ sự tập trung của Liang vào dự án AI.

Professional-grade financial intelligence

20M+ securities. Real-time data. Institutional insights.

Trusted by professionals at Goldman Sachs, BlackRock, and JPMorgan

Tin tức