Az AI-verseny eddig főként az amerikai dominanciáról szólt, olyan óriásokkal, mint az OpenAI, a Google, vagy a Meta. Azonban 2024 végére egy új szereplő robbant be a piacra, amely azóta is lázban tartja az iparágat. A kínai DeepSeek néhány hónap alatt a semmiből vált az egyik legnagyobb AI hatalommá, amivel nemcsak az iparágat, hanem a geopolitikai egyensúlyt is felborította.
Hedge fundból indult technológiai forradalom
A DeepSeek nem egy klasszikus AI-startup. Míg az OpenAI vagy a Google AI-laborjai egyértelműen a technológiai innovációt helyezik a középpontba, a DeepSeek a High-Flyer Capital Management hedge fundból nőtt ki. Ez a cég mesterséges intelligenciát használ a pénzügyi piacok elemzésére és kereskedési döntések meghozatalára.
A High-Flyer egyik társalapítója, Liang Wenfeng, az AI és a pénzügyek összefonódásában látta a jövőt. Először 2015-ben alapította meg a High-Flyert, amely 2019-ben hedge fundként kezdte el működését, majd 2023-ban szétválasztotta az AI-kutatást a pénzügyi tevékenységtől, és létrehozta a DeepSeeket.
A cég már a kezdetektől fogva saját adatközpontokban képezte ki a modelljeit. Az amerikai exportkorlátozások miatt azonban nem használhatta a legújabb Nvidia chipeket. Ezért kénytelen volt a H100-as csúcshardver helyett a gyengébb teljesítményű H800-at alkalmazni. Ennek ellenére a DeepSeek sikeresen versenybe szállt a világ vezető AI-modelljeivel.
A DeepSeek mesterséges intelligenciája: olcsó, hatékony, erős
A DeepSeek 2023 novemberében dobta piacra első modelljeit, köztük a DeepSeek Coder, a DeepSeek LLM, és a DeepSeek Chat alkalmazásokat. Ezek kezdetben nem váltottak ki nagy figyelmet, de 2024 tavaszán a DeepSeek-V2 modellcsalád érkezésével minden megváltozott.
A DeepSeek-V2 olcsóbb és hatékonyabb volt, mint a versenytársak modelljei, ráadásul bizonyos feladatokban még a vezető AI-modellek eredményeit is felülmúlta. Ez oda vezetett, hogy a kínai AI-piac óriásai (pl. ByteDance és Alibaba) drasztikusan csökkentették áraikat, egyes modelljeiket pedig teljesen ingyenessé tették.
A DeepSeek-V3, amely 2024 decemberében debütált, még magasabbra tette a lécet. A cég belső benchmark tesztjei szerint jobban teljesít, mint a Meta nyíltan elérhető Llama-modelljei, és olyan zárt AI-rendszerekkel is versenyképes, mint az OpenAI GPT-4o.
De ami igazán egyedivé teszi a vállalat fejlesztéseit, az az R1 modell, egy „érvelés-alapú” (reasoning) AI, amely 2025 januárjában került bevezetésre. Ez a modell képes önmagát ellenőrizni, így sokkal megbízhatóbb, mint a hagyományos AI-algoritmusok.
Cenzúra és geopolitikai feszültségek
Bár a cég modelljei jól teljesítenek, van egy nagy hátrányuk: a kínai szabályozások korlátozzák őket. Mivel Kínában az AI-törvények szigorúan előírják, hogy a mesterséges intelligencia nem ütközhet az ország hivatalos ideológiájával, a chatbotok nem válaszolnak olyan politikai kérdésekre, mint a Tienanmen téri események vagy Tajvan státusza.
Ez azonban nemcsak etikai vagy filozófiai problémát jelent, hanem komoly geopolitikai következményekkel is jár. Az Egyesült Államok és több nyugati ország egyre gyanakvóbb a DeepSeekkel kapcsolatban: attól tartanak, hogy a kínai kormány politikai befolyásolásra vagy hírszerzésre használhatja az AI-modelljeit.
Ennek eredményeként egyes országok már megtiltották a DeepSeek használatát kormányzati eszközökön, köztük Dél-Korea és az Egyesült Államok New York állama. Sőt, az amerikai kormány várhatóan teljesen kitiltja a DeepSeek modelljeit a kormányzati környezetből.
Mi a DeepSeek üzleti stratégiája?
A DeepSeek furcsa módon nem tűnik klasszikus profitorientált vállalatnak. Míg a legtöbb AI cég bérli vagy licenceli a technológiát, a DeepSeek szinte ingyen adja a modelljeit, és jóval piaci ár alatt kínálja a szolgáltatásait. Ráadásul nem fogad el külső befektetői pénzt, pedig rengeteg kockázati tőkebefektető szeretne beszállni.
A cég állítása szerint a hatékonyságban elért áttörések teszik lehetővé, hogy ilyen alacsony áron működjenek a modelljeik. Egyes szakértők azonban kételkednek ebben, és úgy vélik, hogy a vállalat valójában állami támogatásban részesül, hogy Kína megerősíthesse helyzetét az AI-piacon.
Ez a feltételezés nem alaptalan: 2025 márciusában az OpenAI arra figyelmeztette az amerikai kormányt, hogy a kínai modell egy „államilag támogatott és irányított projekt”, amelyet ki kellene tiltani az USA piacáról.
A DeepSeek hatása az AI-piacra
A DeepSeek sikerének hatása már most érezhető az AI-szektorban. Az Nvidia részvényei 2025 januárjában 18 százalékot zuhantak, részben a DeepSeek miatt, mivel a cég hatékonyabb modelljei csökkentették az AI-hardverek iránti keresletet.
A Microsoft azonban felvette a modellt az Azure AI Foundry platformjára, lehetővé téve a nagyvállalatok számára, hogy kipróbálják a technológiát. A Meta vezérigazgatója, Mark Zuckerberg, pedig az AI-infrastruktúra fejlesztését nevezte a Meta stratégiai előnyének a kínai versenytárs fenyegetésével szemben.
A DeepSeek tehát nemcsak technológiai, hanem gazdasági és geopolitikai szereplővé is vált, és úgy tűnik, hogy még hosszú ideig meghatározó tényező marad az AI-iparban.
(Forrás: TechCrunch)
(Címlapkép: Depositphotos)