Diit.cz - Novinky a informace o hardware, software a internetu

DeepSeek a propad Nvidie o $600 miliard: Praskající bublina nebo čínská blamáž?

Zdroj: Shutterstock

Zatímco před týdnem média čínskou DeepSeek prakticky neznala, dnes ji prezentují jako leadera v modelech umělé inteligence a firmu, jejíž technologie srazily hodnotu Nvidie o $600 miliard. Jenže…

…jak už tomu tak bývá, akciový trh je spíš náladový než racionální a odráží spíš obecné nepochopení podstaty AI segmentu než reálné technologické dopady. Aktuální dění v podstatě připomíná americkou bankovní krizi před zhruba 17 lety, kterou tehdy shrnuli John Bird a John Fortune. V sérii jejich videí se opakovala základní myšlenka: Příčinou krize bylo, že se někdo zeptal, jakou hodnotu vlastně mají nemovitosti, na kterých stojí fondy, které jsou zásadní pro bankovní systém. Nikoli, že by někdo přišel na jejich reálnou hodnotu, ale jen proto že došlo na zvěsti, že by jejich hodnota nemusela být taková, jaká se předpokládá. Jaká byla ve skutečnosti, se ještě ani nepodařilo zjistit, ale banky už šly ke dnu.

Akciový trh v podstatě funguje stejně. Hodnota akcií (samozřejmě i akcií IT firem) je postavená na víře a pokud ji dostatečné procento držitelů akcií ztratí, padá cena akcií a tím i celková hodnota firmy dolů.

Současná situace, kdy čínská společnost DeepSeek vydala svůj nový AI model (software) a důsledkem je pokles hodnoty akcií a to zejména u výrobců hardwaru (například hodnota Nvidie klesla o $600 miliard), je toho dokonalou ukázkou. Čím je vlastně nabídka DeepSeek tak jedinečná?

Benchmark (Metric)   DS V3DS V2.5Qwen2.5Llama3.1Claude-3.5GPT-4o
 90572B-Inst405B-InstSonnet-1022513
   ArchitectureMoEMoEDenseDense--
# Act. Params37B21B72B405B--
# Total Params671B236B72B405B--
Eng.MMLU (EM)88.580.685.388.688.387.2
MMLU-Redux (EM)89.180.385.686.288.988.0
MMLU-Pro (EM)75.966.271.673.378.072.6
DROP (3-shot F1)91.687.876.788.788.383.7

IF-Eval

(Prompt Strict)

86.180.684.186.086.584.3
GPQA-Diamond
(Pass@1)
59.141.349.051.165.049.9
SimpleQA
(Correct)
24.910.29.117.128.438.2
FRAMES (Acc.)73.365.469.870.072.580.5
LongBench v2
(Acc.)
48.735.439.436.141.048.1
Code  HumanEval-Mul
(Pass@1)
82.677.477.377.281.780.5
LiveCodeBench
(Pass@1-COT)
40.529.231.128.436.333.4
LiveCodeBench
(Pass@1)
37.628.428.730.132.834.2
Codeforces
(Percentile)
51.635.624.825.320.323.6
SWE Verified
(Resolved)
42.022.623.824.550.838.8
Aider-Edit (Acc.)79.771.665.463.984.272.9
Aider-Polyglot
(Acc.)
49.618.27.65.845.316.0
Math  AIME 2024
(Pass@1)
39.216.723.323.316.09.3
MATH-500 (EM)90.274.780.073.878.374.6
CNMO 2024
(Pass@1)
43.210.815.96.813.110.8
Chin.  CLUEWSC (EM)90.990.491.484.785.487.9
C-Eval (EM)86.579.586.161.576.776.0
C-SimpleQA
(Correct)
64.154.148.450.451.359.3

Výsledky DeepSeek (DS)

Zatímco výkon a přesnost jejího řešení se zdají být podobné jako u konkurenčních západních (zejména tedy amerických) modelů, největší mediální poprask způsobila informace, že společnost DeepSeek svůj model natrénovala na pouhých 10 000 akcelerátorech z generace Ampere (Nvidia). To je z dnešního pohledu dvě generace stará záležitost, která byla na trhu ještě před AI boomem a z dnešního pohledu je zastaralá jak po stránce energetické efektivity, tak celkového výkonu. Její nástupce Hopper přinesl v základních AI přesnostech jako FP16 a BF16 více než trojnásobek výkonu a v situacích, kdy stačí nižší přesnost, i více než šestinásobek výkonu. Stávající generace Blackwell zase více než zdvojnásobila základní výkon a kde stačí přesnost FP4, je pak asi 5× nad Hopper a asi 22× nad Ampere.

Akcelerátor Hopper H100 (Nvidia)

Celý šok, který je z velké části příčinou vývoje na akciovém trhu, tak nevyplývá z toho, že by DeepSeek přišla s něčím, co je podstatně lepší než produkty, které již existují, ale z toho, že tento model natrénovala na relativně malém množství relativně zastaralých akcelerátorů.

10 000× Ampere nebo 50 000× Hopper?

Problém je, že tento předpoklad může být chybný. V polovině minulého týdne, ještě před hlavní vlnou medializace a propadem akcií, totiž CEO Scale AI Alexandr Wang prohlásil, že informaci o vytvoření tohoto modelu na 10 000 akcelerátorech Ampere nevěří. Nvidia sice nemůže do Číny oficiální cestou exportovat novější akcelerátory, ale to neznamená, že si je čínská firma nemůže opatřit jinou cestou (například přes prostředníka). V návaznosti na Wangovo vyjádření vznikla v určitých kruzích shoda, že model DeepSeek nevznikla na 10 000 akcelerátorů Ampere, ale na 50 000 akcelerátorů Hopper. Což znamená až 6,34 (na akcelerátor) × 5 (počet akcelerátorů) = 32× vyšší výkon pro tréning modelu.

 Nvidia A100Nvidia
H100
Nvidia
B100
Nvidia
B200
GPUGA100GH100GB100
architekturaAmpereHopperBlackwell
formátSXM4SXM5PCIeSXM
 ↓↓↓ T(FL)OPS ↓↓↓
FP4 tensor7/14 P9/18 P
FP6 tensor3,5/7 P4,5/9 P
FP8 tensor1979/3958*1513/3026*3,5/7 P4,5/9 P
FP16 tensor312/624*
989/1979*757/1513*1,8/3,5 P2,3/4,5 P
BF16 tensor312/624*
989/1979*757/1513*??
FP32 tensor19,560? 67?51???
TF32 tensor
156/312*
495/989*378/757*0,9/1,8 P1,1/2,3 P
FP64 tensor
19,567513040
INT8 tensor
624/1248*
1979/3958*1513/3026*3,5/7 P4,5/9 P
INT4 tensor
1248/2496*
????
TDP400 W700-800 W 350 W700W1000W
transistorů54,2 mld.80 mld.208 mld.
plocha GPU826 mm²814 mm²2× >800 mm²
proces7 nm4nm (4N)4nm (4NP)
datum5. 202011. 2020202220242025

Předpoklad, že informace o deseti kiloampérech je blamáž, přijaly i další subjekty. Krom Alexandra Wanga je o tom přesvědčen i Elon Musk a mimo jiné také analytici společnosti Cantor.

Zdá se tedy, že přinejmenším jedna noha, na které stojí předpoklady vedoucí k propadu hodnoty výrobců hardwaru, těžce kulhá. Co druhá noha? Vypadá to, že ani na tom není o mnoho lépe. Z racionálního hlediska totiž nedává smysl, aby širší zpřístupnění nové a přelomové technologie mělo vést k poklesu hodnoty akcií firem, které dodávají hardware, na němž ona technologie běží. Jistě, první myšlenkou může být, že když ku trénování nového modelu stačí hardware o řádově nižším výkonu, pak po výkonnějším hardwaru může klesnout poptávka. To je však silně hypotetický předpoklad. V první řadě proto, že na reálné poptávce se nic nezměnilo, ve druhé řadě proto, že o nižších nárocích panují pochybnosti (viz výše) a za třetí proto, že nižší hardwarové nároky by vedly k širšímu zpřístupnění AI modelů. Jinými slovy subjekty (zejména firmy), které si nasazení AI kvůli cenám hardwaru dosud nemohly dovolit, by najednou zjistily, že jim pro jejich účely stačí podstatně nižší počet akcelerátorů, který si finančně dovolit mohou. Výsledkem by byl opět nárůst poptávky po hardwaru.


Sečteno podtrženo: O praskání bubliny není důvod mluvit. Pokud se ukáže, že DeepSeek skutečně svůj model natrénoval na hardwaru ~32× výkonnějším, než se předpokládalo, pak se vlastně nic až tak zásadního neděje. Pokud by se potvrdilo, že DeepSeek stačilo jen těch 10 kA, pak to naopak způsobí ještě strmější poptávku a rychlejší nasazení AI, což samozřejmě znamená růst prodejů hardwaru.

Hodnota akcií Nvidie strmě klesla, stále je však na říjnové úrovni a zhruba dvojnásobku hodnoty, jakou držela před rokem (roční graf: Google)

Na situaci se však lze dívat i ze zcela jiného úhlu. Nikoli z (řekněme) obchodně-ekonomického hlediska, ale z hlediska mocensky-politického. Můžeme předpokládat, že celý sled událostí byla jedna velká náhoda, ale stejně tak se nelze ubránit myšlence, že mohlo jít o poměrně dobře promyšlený plán. Vypuštění informace, že Čína je schopná na řádově slabším hardwaru natrénovat model směle konkurující těm americkým, může být i jakousi čínskou odvetou za americké sankce, které Čínu formálně odřízly od výkonného hardwaru včetně AI akcelerátorů.

Západní víra, že Čína skutečně nemá a nemůže mít nic lepšího než zastaralé akcelerátory Ampere, jejímž důsledkem je mediální tsunami o zázračném čínském modelu, kterému stačí „pár starých“ akcelerátorů ke konkurenceschopnosti západním modelům vyvinutým na řádově dražším hardwaru, těžce poškodila západní akciový trh a v souhrnu možná o biliony dolarů srazila hodnotu západních firem.

Služby společnosti DeepSeek jsou v posledních dnech z důvodu mediální hysterie přetížené

Čímž se dostáváme zpět na začátek. Stejně jako k vyvolání bankovní krize stačila otázka o ceně nemovitostí a systém se začaly sypat ještě před tím, než byl známá odpověď, tak nyní stačila zvěst o tom, že Čína možná vyvinula schopný AI model na (z dnešního pohledu) podřadném hardwaru a akcie západních firem začaly padat aniž by se potvrdilo, na čem vlastně byl onen model natrénován. Pochybnosti o tvrzení, že DeepSeek staví na silně limitovaném množství staršího hardwaru, se ani v mainstreamových médiích neobjevily.

Co se bude dít dál, je otázka. Záleží na tom, zda jako první nastane vystřízlivění a racionalizace, nebo nastane řetězová reakce a ztráta víry osob prodávajících akcie vyvolá řetězovou reakci, která bude znamenat pokračující pád. Vliv na situaci by mohlo mít i zveřejnění finančních výsledků za předchozí kvartál. To je sice ještě relativně daleko a v podstatě nebude nijak reflektovat stávající situaci, ale akciový trh je velkou měrou ovládán vírou a emocemi. Pěkné finanční výsledky zkrátka mohou akcionáře uklidnit a vést ke stabilizaci situace. Na druhou stranu Nvidia měla před koncem roku s generací Blackwell určité potíže, řešily se problémy s odpadním teplem a hardwaru se podle některých analytiků prodalo méně, než se předpokládalo. Z dlouhodobého hlediska to ale asi na situaci nic moc nezmění a objemy prodejů i marže zůstanou na vysoké úrovni.

Diskuse ke článku DeepSeek a propad Nvidie o $600 miliard: Praskající bublina nebo čínská blamáž?

Čtvrtek, 30 Leden 2025 - 13:59 | friťák | Zvolte si libovolný 5+ let timeframe and zlato...
Čtvrtek, 30 Leden 2025 - 11:42 | general100 | Uz aby tu byl ten necenzurovany, absolutne...
Čtvrtek, 30 Leden 2025 - 08:21 | rathanuviel | Rozumím tomu, jak to myslíte - princip cenzury...
Čtvrtek, 30 Leden 2025 - 00:15 | Grovik | Celý tenhle hlahol je tu hlavně proto aby mohli v...
Středa, 29 Leden 2025 - 22:57 | melkor | A proto se tu potuluje tolik trolů se zeleným...
Středa, 29 Leden 2025 - 22:56 | melkor | >> Jak souvisí velké jazykové modely AI s...
Středa, 29 Leden 2025 - 22:54 | melkor | >> na úrovni architektury se právě ten...
Středa, 29 Leden 2025 - 21:02 | hajčus | Nikdo tě v tom kýblu sraček nedrží, ale ty tu...
Středa, 29 Leden 2025 - 19:34 | vesa | Západní modely mají očesané hooodně moc věcí, i...
Středa, 29 Leden 2025 - 18:21 | satai | Nechci být předčasně optimistický, ale už zase...

Zobrazit diskusi