DeepSeek a propad Nvidie o $600 miliard: Praskající bublina nebo čínská blamáž?
…jak už tomu tak bývá, akciový trh je spíš náladový než racionální a odráží spíš obecné nepochopení podstaty AI segmentu než reálné technologické dopady. Aktuální dění v podstatě připomíná americkou bankovní krizi před zhruba 17 lety, kterou tehdy shrnuli John Bird a John Fortune. V sérii jejich videí se opakovala základní myšlenka: Příčinou krize bylo, že se někdo zeptal, jakou hodnotu vlastně mají nemovitosti, na kterých stojí fondy, které jsou zásadní pro bankovní systém. Nikoli, že by někdo přišel na jejich reálnou hodnotu, ale jen proto že došlo na zvěsti, že by jejich hodnota nemusela být taková, jaká se předpokládá. Jaká byla ve skutečnosti, se ještě ani nepodařilo zjistit, ale banky už šly ke dnu.
Akciový trh v podstatě funguje stejně. Hodnota akcií (samozřejmě i akcií IT firem) je postavená na víře a pokud ji dostatečné procento držitelů akcií ztratí, padá cena akcií a tím i celková hodnota firmy dolů.
Současná situace, kdy čínská společnost DeepSeek vydala svůj nový AI model (software) a důsledkem je pokles hodnoty akcií a to zejména u výrobců hardwaru (například hodnota Nvidie klesla o $600 miliard), je toho dokonalou ukázkou. Čím je vlastně nabídka DeepSeek tak jedinečná?
Benchmark (Metric) | DS V3 | DS V2.5 | Qwen2.5 | Llama3.1 | Claude-3.5 | GPT-4o | |
---|---|---|---|---|---|---|---|
905 | 72B-Inst | 405B-Inst | Sonnet-1022 | 513 | |||
Architecture | MoE | MoE | Dense | Dense | - | - | |
# Act. Params | 37B | 21B | 72B | 405B | - | - | |
# Total Params | 671B | 236B | 72B | 405B | - | - | |
Eng. | MMLU (EM) | 88.5 | 80.6 | 85.3 | 88.6 | 88.3 | 87.2 |
MMLU-Redux (EM) | 89.1 | 80.3 | 85.6 | 86.2 | 88.9 | 88.0 | |
MMLU-Pro (EM) | 75.9 | 66.2 | 71.6 | 73.3 | 78.0 | 72.6 | |
DROP (3-shot F1) | 91.6 | 87.8 | 76.7 | 88.7 | 88.3 | 83.7 | |
IF-Eval (Prompt Strict) | 86.1 | 80.6 | 84.1 | 86.0 | 86.5 | 84.3 | |
GPQA-Diamond (Pass@1) | 59.1 | 41.3 | 49.0 | 51.1 | 65.0 | 49.9 | |
SimpleQA (Correct) | 24.9 | 10.2 | 9.1 | 17.1 | 28.4 | 38.2 | |
FRAMES (Acc.) | 73.3 | 65.4 | 69.8 | 70.0 | 72.5 | 80.5 | |
LongBench v2 (Acc.) | 48.7 | 35.4 | 39.4 | 36.1 | 41.0 | 48.1 | |
Code | HumanEval-Mul (Pass@1) | 82.6 | 77.4 | 77.3 | 77.2 | 81.7 | 80.5 |
LiveCodeBench (Pass@1-COT) | 40.5 | 29.2 | 31.1 | 28.4 | 36.3 | 33.4 | |
LiveCodeBench (Pass@1) | 37.6 | 28.4 | 28.7 | 30.1 | 32.8 | 34.2 | |
Codeforces (Percentile) | 51.6 | 35.6 | 24.8 | 25.3 | 20.3 | 23.6 | |
SWE Verified (Resolved) | 42.0 | 22.6 | 23.8 | 24.5 | 50.8 | 38.8 | |
Aider-Edit (Acc.) | 79.7 | 71.6 | 65.4 | 63.9 | 84.2 | 72.9 | |
Aider-Polyglot (Acc.) | 49.6 | 18.2 | 7.6 | 5.8 | 45.3 | 16.0 | |
Math | AIME 2024 (Pass@1) | 39.2 | 16.7 | 23.3 | 23.3 | 16.0 | 9.3 |
MATH-500 (EM) | 90.2 | 74.7 | 80.0 | 73.8 | 78.3 | 74.6 | |
CNMO 2024 (Pass@1) | 43.2 | 10.8 | 15.9 | 6.8 | 13.1 | 10.8 | |
Chin. | CLUEWSC (EM) | 90.9 | 90.4 | 91.4 | 84.7 | 85.4 | 87.9 |
C-Eval (EM) | 86.5 | 79.5 | 86.1 | 61.5 | 76.7 | 76.0 | |
C-SimpleQA (Correct) | 64.1 | 54.1 | 48.4 | 50.4 | 51.3 | 59.3 |
Výsledky DeepSeek (DS)
Zatímco výkon a přesnost jejího řešení se zdají být podobné jako u konkurenčních západních (zejména tedy amerických) modelů, největší mediální poprask způsobila informace, že společnost DeepSeek svůj model natrénovala na pouhých 10 000 akcelerátorech z generace Ampere (Nvidia). To je z dnešního pohledu dvě generace stará záležitost, která byla na trhu ještě před AI boomem a z dnešního pohledu je zastaralá jak po stránce energetické efektivity, tak celkového výkonu. Její nástupce Hopper přinesl v základních AI přesnostech jako FP16 a BF16 více než trojnásobek výkonu a v situacích, kdy stačí nižší přesnost, i více než šestinásobek výkonu. Stávající generace Blackwell zase více než zdvojnásobila základní výkon a kde stačí přesnost FP4, je pak asi 5× nad Hopper a asi 22× nad Ampere.
Akcelerátor Hopper H100 (Nvidia)
Celý šok, který je z velké části příčinou vývoje na akciovém trhu, tak nevyplývá z toho, že by DeepSeek přišla s něčím, co je podstatně lepší než produkty, které již existují, ale z toho, že tento model natrénovala na relativně malém množství relativně zastaralých akcelerátorů.
10 000× Ampere nebo 50 000× Hopper?
Problém je, že tento předpoklad může být chybný. V polovině minulého týdne, ještě před hlavní vlnou medializace a propadem akcií, totiž CEO Scale AI Alexandr Wang prohlásil, že informaci o vytvoření tohoto modelu na 10 000 akcelerátorech Ampere nevěří. Nvidia sice nemůže do Číny oficiální cestou exportovat novější akcelerátory, ale to neznamená, že si je čínská firma nemůže opatřit jinou cestou (například přes prostředníka). V návaznosti na Wangovo vyjádření vznikla v určitých kruzích shoda, že model DeepSeek nevznikla na 10 000 akcelerátorů Ampere, ale na 50 000 akcelerátorů Hopper. Což znamená až 6,34 (na akcelerátor) × 5 (počet akcelerátorů) = 32× vyšší výkon pro tréning modelu.
Nvidia A100 | Nvidia H100 | Nvidia B100 | Nvidia B200 | |||
---|---|---|---|---|---|---|
GPU | GA100 | GH100 | GB100 | |||
architektura | Ampere | Hopper | Blackwell | |||
formát | SXM4 | SXM5 | PCIe | SXM | ||
↓↓↓ T(FL)OPS ↓↓↓ | ||||||
FP4 tensor | 7/14 P | 9/18 P | ||||
FP6 tensor | 3,5/7 P | 4,5/9 P | ||||
FP8 tensor | 1979/3958* | 1513/3026* | 3,5/7 P | 4,5/9 P | ||
FP16 tensor | 312/624* | 989/1979* | 757/1513* | 1,8/3,5 P | 2,3/4,5 P | |
BF16 tensor | 312/624* | 989/1979* | 757/1513* | ? | ? | |
FP32 tensor | 19,5 | 60? 67? | 51? | ? | ? | |
TF32 tensor | 156/312* | 495/989* | 378/757* | 0,9/1,8 P | 1,1/2,3 P | |
FP64 tensor | 19,5 | 67 | 51 | 30 | 40 | |
INT8 tensor | 624/1248* | 1979/3958* | 1513/3026* | 3,5/7 P | 4,5/9 P | |
INT4 tensor | 1248/2496* | ? | ? | ? | ? | |
TDP | 400 W | 700-800 W | 350 W | 700W | 1000W | |
transistorů | 54,2 mld. | 80 mld. | 208 mld. | |||
plocha GPU | 826 mm² | 814 mm² | 2× >800 mm² | |||
proces | 7 nm | 4nm (4N) | 4nm (4NP) | |||
datum | 5. 2020 | 11. 2020 | 2022 | 2024 | 2025 |
Předpoklad, že informace o deseti kiloampérech je blamáž, přijaly i další subjekty. Krom Alexandra Wanga je o tom přesvědčen i Elon Musk a mimo jiné také analytici společnosti Cantor.
Zdá se tedy, že přinejmenším jedna noha, na které stojí předpoklady vedoucí k propadu hodnoty výrobců hardwaru, těžce kulhá. Co druhá noha? Vypadá to, že ani na tom není o mnoho lépe. Z racionálního hlediska totiž nedává smysl, aby širší zpřístupnění nové a přelomové technologie mělo vést k poklesu hodnoty akcií firem, které dodávají hardware, na němž ona technologie běží. Jistě, první myšlenkou může být, že když ku trénování nového modelu stačí hardware o řádově nižším výkonu, pak po výkonnějším hardwaru může klesnout poptávka. To je však silně hypotetický předpoklad. V první řadě proto, že na reálné poptávce se nic nezměnilo, ve druhé řadě proto, že o nižších nárocích panují pochybnosti (viz výše) a za třetí proto, že nižší hardwarové nároky by vedly k širšímu zpřístupnění AI modelů. Jinými slovy subjekty (zejména firmy), které si nasazení AI kvůli cenám hardwaru dosud nemohly dovolit, by najednou zjistily, že jim pro jejich účely stačí podstatně nižší počet akcelerátorů, který si finančně dovolit mohou. Výsledkem by byl opět nárůst poptávky po hardwaru.
Sečteno podtrženo: O praskání bubliny není důvod mluvit. Pokud se ukáže, že DeepSeek skutečně svůj model natrénoval na hardwaru ~32× výkonnějším, než se předpokládalo, pak se vlastně nic až tak zásadního neděje. Pokud by se potvrdilo, že DeepSeek stačilo jen těch 10 kA, pak to naopak způsobí ještě strmější poptávku a rychlejší nasazení AI, což samozřejmě znamená růst prodejů hardwaru.
Hodnota akcií Nvidie strmě klesla, stále je však na říjnové úrovni a zhruba dvojnásobku hodnoty, jakou držela před rokem (roční graf: Google)
Na situaci se však lze dívat i ze zcela jiného úhlu. Nikoli z (řekněme) obchodně-ekonomického hlediska, ale z hlediska mocensky-politického. Můžeme předpokládat, že celý sled událostí byla jedna velká náhoda, ale stejně tak se nelze ubránit myšlence, že mohlo jít o poměrně dobře promyšlený plán. Vypuštění informace, že Čína je schopná na řádově slabším hardwaru natrénovat model směle konkurující těm americkým, může být i jakousi čínskou odvetou za americké sankce, které Čínu formálně odřízly od výkonného hardwaru včetně AI akcelerátorů.
Západní víra, že Čína skutečně nemá a nemůže mít nic lepšího než zastaralé akcelerátory Ampere, jejímž důsledkem je mediální tsunami o zázračném čínském modelu, kterému stačí „pár starých“ akcelerátorů ke konkurenceschopnosti západním modelům vyvinutým na řádově dražším hardwaru, těžce poškodila západní akciový trh a v souhrnu možná o biliony dolarů srazila hodnotu západních firem.
Služby společnosti DeepSeek jsou v posledních dnech z důvodu mediální hysterie přetížené
Čímž se dostáváme zpět na začátek. Stejně jako k vyvolání bankovní krize stačila otázka o ceně nemovitostí a systém se začaly sypat ještě před tím, než byl známá odpověď, tak nyní stačila zvěst o tom, že Čína možná vyvinula schopný AI model na (z dnešního pohledu) podřadném hardwaru a akcie západních firem začaly padat aniž by se potvrdilo, na čem vlastně byl onen model natrénován. Pochybnosti o tvrzení, že DeepSeek staví na silně limitovaném množství staršího hardwaru, se ani v mainstreamových médiích neobjevily.
Co se bude dít dál, je otázka. Záleží na tom, zda jako první nastane vystřízlivění a racionalizace, nebo nastane řetězová reakce a ztráta víry osob prodávajících akcie vyvolá řetězovou reakci, která bude znamenat pokračující pád. Vliv na situaci by mohlo mít i zveřejnění finančních výsledků za předchozí kvartál. To je sice ještě relativně daleko a v podstatě nebude nijak reflektovat stávající situaci, ale akciový trh je velkou měrou ovládán vírou a emocemi. Pěkné finanční výsledky zkrátka mohou akcionáře uklidnit a vést ke stabilizaci situace. Na druhou stranu Nvidia měla před koncem roku s generací Blackwell určité potíže, řešily se problémy s odpadním teplem a hardwaru se podle některých analytiků prodalo méně, než se předpokládalo. Z dlouhodobého hlediska to ale asi na situaci nic moc nezmění a objemy prodejů i marže zůstanou na vysoké úrovni.