DeepSeek, nouseva kiinalainen AI-startup, on aiheuttanut kansainvälisessä teknomaailmassa kohua julkaisemalla uusimman kielimallinsa R1. Hedgerahasto miljardööri Liang Wenfengin johtama yritys esitteli yksityiskohtaisen ohjeen siitä, miten tehokas AI-malli voidaan kehittää rajallisilla resursseilla – askel, joka edistää Kiinan teknologisia pyrkimyksiä Yhdysvaltain pakotteista huolimatta.
Das in Hangzhou ansässige Unternehmen veröffentlichte am Montag eine technische Analyse seines Modells, das auf nur 2.048 Nvidia H800-Chips und mit einem Budget von 5,6 Millionen US-Dollar trainiert wurde. Damit hat DeepSeek eine kosteneffiziente Alternative zu den milliardenschweren Projekten westlicher Konkurrenten wie OpenAI und Google DeepMind geschaffen, die bisher ihre Methoden geheim hielten.
Liang Wenfeng, alunperin kvanttikauppias, alkoi vuonna 2021 rakentaa tekoälyinfrastruktuuria hedge-rahastonsa High-Flyerin sisällä. Alan asiantuntijat pitivät hänen kunnianhimoisia suunnitelmiaan aluksi epärealistisina. Kuitenkin korkeasti koulutettujen insinöörien tiimin ja syvällisen ymmärryksen avulla GPU:iden käytöstä DeepSeek pystyi maksimoimaan laitteiston tehokkuuden.
Yhdysvaltain huippusuorituskykyisten sirujen vientikieltojen jälkeen DeepSeek panosti innovatiivisiin koulutusmenetelmiin, jotka erottavat yrityksen amerikkalaisista kilpailijoistaan. Liang käyttää voittoja hedge-rahastostaan houkutellakseen huippuosaajia Kiinan huippuyliopistoista ja perustaakseen täysin kiinalaisen tutkimus- ja kehitysrakenteen.
DeepSeek noudattaa epätavanomaista strategiaa paljastamalla tutkimustulokset niiden kaupallisen suojaamisen sijaan. Tämä herättää huomiota alalla ja lisää painetta läntisille kilpailijoille. Samalla on epäselvää, voiko yritys pitkällä aikavälillä pysyä Yhdysvaltojen jättiläisten nopean teknologisen kehityksen mukana, erityisesti kun otetaan huomioon OpenAI:n ja SoftBankin suunnittelemat miljardien investoinnit tekoälyinfrastruktuuriin.
Huolimatta vaikuttavista edistysaskeleista taloudellisen kestävyyden epävarmuus säilyy. Vaikka yhdysvaltalaiset yritykset, kuten Elon Muskin xAI, luottavat valtaviin supertietokoneklustereihin, DeepSeek saattaa tulevaisuudessa kohdata kapasiteettirajoitteita. Hedge-rahasto High-Flyerin viimeaikainen suorituskyky osoittaa jo merkkejä rasituksista Liangin keskittyessä tekoälyprojektiin.