DeepSeek: elillant a nagy amerikai tech-cégek fölénye, de a semmiből felbukkant kínai cég körül is egyre több a kérdőjel
Úgy fest, a DeepSeek felrobbantotta az ipar eddig biztosnak hitt narratíváját az AI végtelen energia- és erőforrásigényéről, és akár véget is vethet az „AI-hasznosítással” operáló cégek varázsának a Wall Streeten. A befektetések dollármilliárdjait vonzó nagy nevekkel szemben (mint amilyen az OpenAI mellett az Nvidia, az Alphabet, a Microsoft stb.) most megjelent egy új kínai szereplő, és rámutat: egyáltalán nem biztos, hogy az USA meg tudja tartani vezető szerepét a technológia fejlesztésében.
„Ez hatalmas földrengés az AI szektorban. Mindenki csak néz, és azt mondja: 'nem gondoltuk volna, hogy ez lehetséges’. Most, hogy mégis az, át kell gondolnunk mindent, amit eddig terveztünk” – vallotta be a CNN-nek Gil Luria, a D.A. Davidson befektetési csoport technológiai kutatási vezetője.
Ugyancsak kellemetlen pillanat ez a Trump-adminisztráció számára, hiszen az új elnök gyakorlatilag napokkal a DeepSeek megjelenése előtt jelentett be félbillió dolláros magánszektorból származó amerikai befektetést olyan adatközpontok építésére, amelyekkel az Egyesült Államok megőrizhetné vezető szerepét az AI fejlesztésében. Talán még az USA kormányzatánál is rosszabbul érintheti a kínai nyelvi modell megjelenése az AI-chip szállító Nvidiát, hiszen történelmi veszteséget szenvedett el, miután a részvényeinek értéke a DeepSeek hatására egy nap alatt 17 százalékot, körülbelül 600 milliárd dollárt zuhant.

Az Nvidia eddig az AI-forradalom legnagyobb nyertese volt: háromtrillió dolláros vállalattá vált, de ha a kínaiak valóban képesek voltak ChatGPT-szintű modellt alkotni tizedannyi (vagy kevesebb), korábbi generációs processzorral, akkor lehet, hogy az ügyfelei nem fognak a jövőben annyi chipet vásárolni, amennyit a cég remélt. Bár teljesen kizárt, hogy az Nvidia emiatt feltenné a kezét (nincs is rá oka, hiszen a nyelvi modelleken túl önvezető, robotikai és más AI technológiák egész sorához szállít hardvereket), azért elismerte: a DeepSeek modellje „kiváló AI-fejlesztés”, amely „jól illusztrálja, hogy hogyan lehet új modelleket létrehozni”.
Az eddigi narratíva szerint az AI fejlesztéséhez folyamatosan növelni kell a számítási kapacitást, de a kínai AI megjelenése „egyértelművé teszi, hogy az adatközpontok nagy mértékű skálázása aligha lesz gazdaságilag kifizetődő” – mondta Luria.
Ugyanakkor a Szeretlek Magyarországnak nyilatkozó Balogh Petya szerint a DeepSeek létezése jó hír, mert demokratikusabb irányba viszi az AI-fejlesztést. Az AI fejlődéséről és várható üzleti hatásairól cégvezetői oktatást is szervező üzletember szerint a kínai nyelvi modellnek köszönhetően nem fog monopol helyzetbe kerülni maroknyi amerikai cég – ahogy az történt az online keresés (Google) vagy éppen a közösségi média esetében (Facebook).
Ha az USA nagytőkés technológiai vállalkozásainak nem is, az AI demokratizálódásának valóban jót tesz, hogy piacra lépett egy sokkal olcsóbban előállított, forráskódját ingyen megosztó alkalmazás. Azt azonban az amerikaiak vitatják, hogy a Deepseek tényleg csak egy kicsi kínai startup lenne, amely mindössze 5,6 millió dollárból létrehozta azt, amit nekik csak sok milliárd dollárból sikerült.
Több amerikai cég is bedobta: adatot lophatott a DeepSeek
A Microsoft és az OpenAI vizsgálatot indított annak kiderítésére, hogy egy, a kínai DeepSeek startuphoz köthető csoport jogosulatlanul szerzett-e adatokat az OpenAI technológiájából – értesült a Bloomberg. A Microsoft biztonsági szakértői azt állítják, már tavaly ősszel észlelték, hogy valakik nagy mennyiségű adathoz juthattak az OpenAI alkalmazásprogramozási felületén keresztül, ami az OpenAI szolgáltatásainak fő hozzáférési pontja a szoftverfejlesztők és ügyfelek számára.
David Sacks, a Fehér Ház mesterséges intelligenciáért és kriptovalutákért felelős szakértője a Fox Newsnak adott interjúban azt mondta, valóban „lehetséges”, hogy a DeepSeek amerikai szellemi tulajdont lopott. „Jelentős bizonyítékok utalnak arra, hogy a DeepSeek lényegében kinyerte az OpenAI modelljeiből a tudást” - fogalmazott.
A mesterséges intelligencia iparban elterjedt gyakorlat az ún. „desztillálás”, ami lehetővé teszi egy meglévő modellből származtatott, hatékonyabb rendszer kialakítását. Ez általában teljesen legális folyamat – egészen addig, amíg nem egy cég zárt, védett technológia adatait használják fel, mert az már komoly jogi problémákat vethet fel. A OpenAI felhasználási feltételei világosan kimondják, hogy az általuk generált adatokat tilos felhasználni versenytárs technológia létrehozására. Persze, hogy a Deepseek esetében mindez ténylegesen megtörtént-e, arra egyelőre nincs egyértelmű bizonyíték.
„Tudjuk, hogy a Kínai Népköztársaságban aktívan dolgoznak azon, hogy lemásolják a fejlett amerikai AI-modelleket” – nyilatkozta Liz Bourgeois, az OpenAI szóvivője a The New York Timesnak. „Jelenleg vizsgáljuk, hogy a DeepSeek jogosulatlanul használta-e fel a modelljeinket, és ha több információval rendelkezünk, megosztjuk azt.”
Nem is egy kicsi cég?
A Deepseek megjelenése azért robbant ekkorát, mert ha igaz, amit állítanak, akkor az eddig gondoltnál nagyságrendekkel kevesebből is elő lehet állítani mesterséges intelligenciát, nincs szükség óriási mennyiségű fejlett chipre, különleges videókártyákra, hatalmas adatközpontokra. Azt állítják, erre egy kicsi startup is képes lehet.
A 2019-ben alapított Deepseek mögött egy Liang Wenfeng nevű üzletember és a High-Flyer Quant nevű hedge fund áll. Liang Wenfeng szerint a DeepSeek működése radikálisan eltér a nagyobb tech-cégekétől: míg például az Alibaba több százezer alkalmazottat foglalkoztat, ők egy kutatóintézetre hasonlítanak, amelyet főként frissen végzett egyetemisták és doktorandusz hallgatók alkotnak. Liang szerint a hagyományos tech-mamutok „nem biztos, hogy alkalmasak a jövő AI-iparának formálására” a magas költségek és merev szervezeti struktúrák miatt.
Ugyanakkor a Forbes arról ír, hogy egyáltalán nem biztos, hogy a DeepSeek tényleg annyira kicsi, amekkorának láttatni próbálja magát. Egyes források szerint
Az is furcsa, hogy a cégnek nincsenek kereskedelmi tervei, látszólag nem érdeklik őket a bevételek. Az amerikaiak szerint mindez arra utal, hogy a vállalkozás mögött valójában a kínai állam állhat, amely így próbál globális pozíciókat elfoglalni a mesterséges intelligencia-elsőségért folyó versenyben.
Lopás nélkül nincs is AI?
Persze az is lehet, hogy mindez csak egy kommunikációs ellencsapás az amerikai techcégek részéről, ráadásul az ő esetükben sem egyértelmű, hogy jogilag tiszta megoldásokkal képezték ki saját modelljeiket.
A The New York Times is pert indított az OpenAI és partnere, a Microsoft ellen, mivel állításuk szerint cikkeik millióit használták fel a chatbot képzésére, ami a hírforrások konkurenciájává válhat.
Egy nemrég készült jelentés ráadásul arra is rámutatott, hogy az OpenAI YouTube-videók hanganyagaiból szintén leiratot készített, hogy aztán az AI-modelljei továbbfejlesztésére használja fel. Belső levelezések szerint a vezetők tudták, hogy ez szembe mehet a YouTube irányelveivel, ennek ellenére, egy belső csapat – amelynek tagja volt Greg Brockman, az OpenAI elnöke is – több mint egymillió órányi YouTube-videót dolgozhatott fel, hogy aztán a szöveges adatokat a GPT-4 modellbe töltse és ezzel alaposan felhúzza annak tudásbázisát.

A OpenAI vezérigazgatója, Sam Altman korábban elismerte, hogy a fejlett mesterséges intelligencia modellek betanításához szerzői jogvédelem alatt álló anyagokra van szükség, és kijelentette, hogy enélkül lehetetlen lenne ilyen rendszereket fejleszteni. A kijelentés azonnal felháborodást váltott ki a közösségi médiában, és most vissza is hullik a vállalat fejére:
Egy Bluesky-felhasználó így fogalmazott: „nevetséges, hogy az OpenAI, amely minden kérdés nélkül falta fel az adatainkat, most ujjal mutogat a DeepSeekre, amiért pontosan ugyanezt csinálja”. Ed Zitron AI-kritikus pedig így kommentálta az ügyet: „elnézést, de nem bírom abbahagyni a röhögést. Az OpenAI, a vállalat, amely gyakorlatilag az egész internet ellopására épült, most azért panaszkodik, mert a DeepSeek esetleg a ChatGPT válaszaiból tanult.”
Újabb AI-modellek jönnek, a cél az AGI
Miközben mindenki a DeepSeek sikerére és az amerikai AI-cégek befeszülésére figyelt, az Alibaba is bejelentett egy új mesterséges intelligencia modellt, a Qwen 2.5-Max-ot. A kínai tech-óriás szerint az új modell „szinte minden területen felülmúlja a GPT-4o-t, a DeepSeek-V3-at és a Llama-3.1-405B-t [a Meta AI-modelljét]” – idézi az Alibaba Cloud hivatalos WeChat-oldalát a Reuters.
A bejelentés időzítése azt mutatja, hogy az Alibaba komoly nyomást érez a hazai versenytársak részéről, és valószínűleg így volt ezzel a TikTok anyavállalata, a ByteDance is, amikor két nappal a DeepSeek-R1 január 20-i megjelenése után közölte: frissítette saját AI-modelljét, amely szerintük szintén felülmúlja az OpenAI által kifejlesztett terméket. Ezt az állítást igazolták is egy AIME benchmark teszttel, ami azt méri, hogy egy mesterséges intelligencia modell mennyire érti az összetett utasításokat és hogyan reagál rájuk.
Mindez arra utal, hogy bármi is az igazság a DeepSeekről, Amerika komoly versenytársakkal nézhet szembe.