DeepSeek a propad Nvidie o $600 miliard: Praskající bublina nebo čínská blamáž?

29. 1. 2025 | no-X | Hardware, Novinky, Grafiky, Business, Technologie

Zdroj: Shutterstock

Zatímco před týdnem média čínskou DeepSeek prakticky neznala, dnes ji prezentují jako leadera v modelech umělé inteligence a firmu, jejíž technologie srazily hodnotu Nvidie o $600 miliard. Jenže…

…jak už tomu tak bývá, akciový trh je spíš náladový než racionální a odráží spíš obecné nepochopení podstaty AI segmentu než reálné technologické dopady. Aktuální dění v podstatě připomíná americkou bankovní krizi před zhruba 17 lety, kterou tehdy shrnuli John Bird a John Fortune. V sérii jejich videí se opakovala základní myšlenka: Příčinou krize bylo, že se někdo zeptal, jakou hodnotu vlastně mají nemovitosti, na kterých stojí fondy, které jsou zásadní pro bankovní systém. Nikoli, že by někdo přišel na jejich reálnou hodnotu, ale jen proto že došlo na zvěsti, že by jejich hodnota nemusela být taková, jaká se předpokládá. Jaká byla ve skutečnosti, se ještě ani nepodařilo zjistit, ale banky už šly ke dnu.

Akciový trh v podstatě funguje stejně. Hodnota akcií (samozřejmě i akcií IT firem) je postavená na víře a pokud ji dostatečné procento držitelů akcií ztratí, padá cena akcií a tím i celková hodnota firmy dolů.

Současná situace, kdy čínská společnost DeepSeek vydala svůj nový AI model (software) a důsledkem je pokles hodnoty akcií a to zejména u výrobců hardwaru (například hodnota Nvidie klesla o $600 miliard), je toho dokonalou ukázkou. Čím je vlastně nabídka DeepSeek tak jedinečná?

Benchmark (Metric)		DS V3	DS V2.5	Qwen2.5	Llama3.1	Claude-3.5	GPT-4o
Benchmark (Metric)			905	72B-Inst	405B-Inst	Sonnet-1022	513
	Architecture	MoE	MoE	Dense	Dense	-	-
	# Act. Params	37B	21B	72B	405B	-	-
	# Total Params	671B	236B	72B	405B	-	-
Eng.	MMLU (EM)	88.5	80.6	85.3	88.6	88.3	87.2
	MMLU-Redux (EM)	89.1	80.3	85.6	86.2	88.9	88.0
	MMLU-Pro (EM)	75.9	66.2	71.6	73.3	78.0	72.6
	DROP (3-shot F1)	91.6	87.8	76.7	88.7	88.3	83.7
	IF-Eval (Prompt Strict)	86.1	80.6	84.1	86.0	86.5	84.3
	GPQA-Diamond (Pass@1)	59.1	41.3	49.0	51.1	65.0	49.9
	SimpleQA (Correct)	24.9	10.2	9.1	17.1	28.4	38.2
	FRAMES (Acc.)	73.3	65.4	69.8	70.0	72.5	80.5
	LongBench v2 (Acc.)	48.7	35.4	39.4	36.1	41.0	48.1
Code	HumanEval-Mul (Pass@1)	82.6	77.4	77.3	77.2	81.7	80.5
	LiveCodeBench (Pass@1-COT)	40.5	29.2	31.1	28.4	36.3	33.4
	LiveCodeBench (Pass@1)	37.6	28.4	28.7	30.1	32.8	34.2
	Codeforces (Percentile)	51.6	35.6	24.8	25.3	20.3	23.6
	SWE Verified (Resolved)	42.0	22.6	23.8	24.5	50.8	38.8
	Aider-Edit (Acc.)	79.7	71.6	65.4	63.9	84.2	72.9
	Aider-Polyglot (Acc.)	49.6	18.2	7.6	5.8	45.3	16.0
Math	AIME 2024 (Pass@1)	39.2	16.7	23.3	23.3	16.0	9.3
	MATH-500 (EM)	90.2	74.7	80.0	73.8	78.3	74.6
	CNMO 2024 (Pass@1)	43.2	10.8	15.9	6.8	13.1	10.8
Chin.	CLUEWSC (EM)	90.9	90.4	91.4	84.7	85.4	87.9
	C-Eval (EM)	86.5	79.5	86.1	61.5	76.7	76.0
	C-SimpleQA (Correct)	64.1	54.1	48.4	50.4	51.3	59.3

Výsledky DeepSeek (DS)

Zatímco výkon a přesnost jejího řešení se zdají být podobné jako u konkurenčních západních (zejména tedy amerických) modelů, největší mediální poprask způsobila informace, že společnost DeepSeek svůj model natrénovala na pouhých 10 000 akcelerátorech z generace Ampere (Nvidia). To je z dnešního pohledu dvě generace stará záležitost, která byla na trhu ještě před AI boomem a z dnešního pohledu je zastaralá jak po stránce energetické efektivity, tak celkového výkonu. Její nástupce Hopper přinesl v základních AI přesnostech jako FP16 a BF16 více než trojnásobek výkonu a v situacích, kdy stačí nižší přesnost, i více než šestinásobek výkonu. Stávající generace Blackwell zase více než zdvojnásobila základní výkon a kde stačí přesnost FP4, je pak asi 5× nad Hopper a asi 22× nad Ampere.

Akcelerátor Hopper H100 (Nvidia)

Celý šok, který je z velké části příčinou vývoje na akciovém trhu, tak nevyplývá z toho, že by DeepSeek přišla s něčím, co je podstatně lepší než produkty, které již existují, ale z toho, že tento model natrénovala na relativně malém množství relativně zastaralých akcelerátorů.

10 000× Ampere nebo 50 000× Hopper?

Problém je, že tento předpoklad může být chybný. V polovině minulého týdne, ještě před hlavní vlnou medializace a propadem akcií, totiž CEO Scale AI Alexandr Wang prohlásil, že informaci o vytvoření tohoto modelu na 10 000 akcelerátorech Ampere nevěří. Nvidia sice nemůže do Číny oficiální cestou exportovat novější akcelerátory, ale to neznamená, že si je čínská firma nemůže opatřit jinou cestou (například přes prostředníka). V návaznosti na Wangovo vyjádření vznikla v určitých kruzích shoda, že model DeepSeek nevznikla na 10 000 akcelerátorů Ampere, ale na 50 000 akcelerátorů Hopper. Což znamená až 6,34 (na akcelerátor) × 5 (počet akcelerátorů) = 32× vyšší výkon pro tréning modelu.

	Nvidia A100		Nvidia H100		Nvidia B100	Nvidia B200
GPU	GA100		GH100		GB100
architektura	Ampere		Hopper		Blackwell
formát	SXM4		SXM5	PCIe	SXM
	↓↓↓ T(FL)OPS ↓↓↓
FP4 tensor					7/14 P	9/18 P
FP6 tensor					3,5/7 P	4,5/9 P
FP8 tensor			1979/3958*	1513/3026*	3,5/7 P	4,5/9 P
FP16 tensor	312/624*		989/1979*	757/1513*	1,8/3,5 P	2,3/4,5 P
BF16 tensor	312/624*		989/1979*	757/1513*	?	?
FP32 tensor	19,5		60? 67?	51?	?	?
TF32 tensor	156/312*		495/989*	378/757*	0,9/1,8 P	1,1/2,3 P
FP64 tensor	19,5		67	51	30	40
INT8 tensor	624/1248*		1979/3958*	1513/3026*	3,5/7 P	4,5/9 P
INT4 tensor	1248/2496*		?	?	?	?
TDP	400 W		700-800 W	350 W	700W	1000W
transistorů	54,2 mld.		80 mld.		208 mld.
plocha GPU	826 mm²		814 mm²		2× >800 mm²
proces	7 nm		4nm (4N)		4nm (4NP)
datum	5. 2020	11. 2020	2022		2024	2025

Předpoklad, že informace o deseti kiloampérech je blamáž, přijaly i další subjekty. Krom Alexandra Wanga je o tom přesvědčen i Elon Musk a mimo jiné také analytici společnosti Cantor.

Zdá se tedy, že přinejmenším jedna noha, na které stojí předpoklady vedoucí k propadu hodnoty výrobců hardwaru, těžce kulhá. Co druhá noha? Vypadá to, že ani na tom není o mnoho lépe. Z racionálního hlediska totiž nedává smysl, aby širší zpřístupnění nové a přelomové technologie mělo vést k poklesu hodnoty akcií firem, které dodávají hardware, na němž ona technologie běží. Jistě, první myšlenkou může být, že když ku trénování nového modelu stačí hardware o řádově nižším výkonu, pak po výkonnějším hardwaru může klesnout poptávka. To je však silně hypotetický předpoklad. V první řadě proto, že na reálné poptávce se nic nezměnilo, ve druhé řadě proto, že o nižších nárocích panují pochybnosti (viz výše) a za třetí proto, že nižší hardwarové nároky by vedly k širšímu zpřístupnění AI modelů. Jinými slovy subjekty (zejména firmy), které si nasazení AI kvůli cenám hardwaru dosud nemohly dovolit, by najednou zjistily, že jim pro jejich účely stačí podstatně nižší počet akcelerátorů, který si finančně dovolit mohou. Výsledkem by byl opět nárůst poptávky po hardwaru.

Sečteno podtrženo: O praskání bubliny není důvod mluvit. Pokud se ukáže, že DeepSeek skutečně svůj model natrénoval na hardwaru ~32× výkonnějším, než se předpokládalo, pak se vlastně nic až tak zásadního neděje. Pokud by se potvrdilo, že DeepSeek stačilo jen těch 10 kA, pak to naopak způsobí ještě strmější poptávku a rychlejší nasazení AI, což samozřejmě znamená růst prodejů hardwaru.

Hodnota akcií Nvidie strmě klesla, stále je však na říjnové úrovni a zhruba dvojnásobku hodnoty, jakou držela před rokem (roční graf: Google)

Na situaci se však lze dívat i ze zcela jiného úhlu. Nikoli z (řekněme) obchodně-ekonomického hlediska, ale z hlediska mocensky-politického. Můžeme předpokládat, že celý sled událostí byla jedna velká náhoda, ale stejně tak se nelze ubránit myšlence, že mohlo jít o poměrně dobře promyšlený plán. Vypuštění informace, že Čína je schopná na řádově slabším hardwaru natrénovat model směle konkurující těm americkým, může být i jakousi čínskou odvetou za americké sankce, které Čínu formálně odřízly od výkonného hardwaru včetně AI akcelerátorů.

Nvidia kritizuje Bidena, na poslední chvíli v tichosti vydal 200 stran regulací

Západní víra, že Čína skutečně nemá a nemůže mít nic lepšího než zastaralé akcelerátory Ampere, jejímž důsledkem je mediální tsunami o zázračném čínském modelu, kterému stačí „pár starých“ akcelerátorů ke konkurenceschopnosti západním modelům vyvinutým na řádově dražším hardwaru, těžce poškodila západní akciový trh a v souhrnu možná o biliony dolarů srazila hodnotu západních firem.

Služby společnosti DeepSeek jsou v posledních dnech z důvodu mediální hysterie přetížené

Čímž se dostáváme zpět na začátek. Stejně jako k vyvolání bankovní krize stačila otázka o ceně nemovitostí a systém se začaly sypat ještě před tím, než byl známá odpověď, tak nyní stačila zvěst o tom, že Čína možná vyvinula schopný AI model na (z dnešního pohledu) podřadném hardwaru a akcie západních firem začaly padat aniž by se potvrdilo, na čem vlastně byl onen model natrénován. Pochybnosti o tvrzení, že DeepSeek staví na silně limitovaném množství staršího hardwaru, se ani v mainstreamových médiích neobjevily.

Co se bude dít dál, je otázka. Záleží na tom, zda jako první nastane vystřízlivění a racionalizace, nebo nastane řetězová reakce a ztráta víry osob prodávajících akcie vyvolá řetězovou reakci, která bude znamenat pokračující pád. Vliv na situaci by mohlo mít i zveřejnění finančních výsledků za předchozí kvartál. To je sice ještě relativně daleko a v podstatě nebude nijak reflektovat stávající situaci, ale akciový trh je velkou měrou ovládán vírou a emocemi. Pěkné finanční výsledky zkrátka mohou akcionáře uklidnit a vést ke stabilizaci situace. Na druhou stranu Nvidia měla před koncem roku s generací Blackwell určité potíže, řešily se problémy s odpadním teplem a hardwaru se podle některých analytiků prodalo méně, než se předpokládalo. Z dlouhodobého hlediska to ale asi na situaci nic moc nezmění a objemy prodejů i marže zůstanou na vysoké úrovni.

Tagy:

AI, USA, Čína, akcie, Nvidia, DeepSeek

Zdroje:

CNBC, Walter Bloomberg, DeepSeek

nahlásit chybu

Jiří "no-X" Souček

více článků, blogů a informací o autorovi

Diskuse ke článku DeepSeek a propad Nvidie o $600 miliard: Praskající bublina nebo čínská blamáž?

Neděle, 9 Březen 2025 - 00:47 | jupiii | No jo JirkaK... "za par dni" znamena,...

Pátek, 31 Leden 2025 - 01:31 | Ladis | Takže předžvýkaná data. Musel být na začátku...

Čtvrtek, 30 Leden 2025 - 21:43 | Dawe | Třeba někdo chtěl koupit akcie NVidie levněji.

Čtvrtek, 30 Leden 2025 - 21:26 | Dawe | Já bych akcionáře přirovnal k hejnu lekavých...

Čtvrtek, 30 Leden 2025 - 19:14 | hajčus | Už se těším na tu hromadnou emigraci Patriotů do...

Čtvrtek, 30 Leden 2025 - 14:51 | hajčus | Je hezké, že má autor vlastního stalkera, inu...

Čtvrtek, 30 Leden 2025 - 13:59 | friťák | Zvolte si libovolný 5+ let timeframe and zlato...

Čtvrtek, 30 Leden 2025 - 11:42 | general100 | Uz aby tu byl ten necenzurovany, absolutne...

Čtvrtek, 30 Leden 2025 - 08:21 | rathanuviel | Rozumím tomu, jak to myslíte - princip cenzury...

Čtvrtek, 30 Leden 2025 - 00:15 | Grovik | Celý tenhle hlahol je tu hlavně proto aby mohli v...

Zobrazit diskusi

Diit.cz - Novinky a informace o hardware, software a internetu

DeepSeek a propad Nvidie o $600 miliard: Praskající bublina nebo čínská blamáž?

10 000× Ampere nebo 50 000× Hopper?

Jiří "no-X" Souček

Diskuse ke článku DeepSeek a propad Nvidie o $600 miliard: Praskající bublina nebo čínská blamáž?

Komerční sdělení

CDR Hry

Vědci ukázali robota, který zvládne Mars rychleji než dnešní mise

Kvantová baterie z Austrálie mění pravidla hry. Nabíjení může trvat vteřiny

86 % phishingu už řídí AI. Útoky míří mimo e-mail a jsou rychlejší než kdy dřív

Má AI svá temná zákoutí podobně jako Darkweb?

Kyslík nestačí. Nová studie ukazuje jiný způsob hledání života ve vesmíru

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT