Nvidia uvádí DGX GH200 AI Supercomputer jako 1 EFLOPS řešení. Jenže…

30. 5. 2023 | no-X | Hardware, Novinky, Grafiky

V době uvedení výpočetního GPU Hopper ohlásila Nvidia také tzv. Grace Hopper superchip alias Hopper GPU a Grace CPU (ARM) na jednom PCB. Zahájení jeho výroby nyní ohlásila, k tomu i superpočítač…

Nejde však o jeden konkrétní superpočítač stavěný na míru pro konkrétního zákazníka, ale standardizovaný produkt pro sériovou výrobu. Prezentován je jako řešení, které dosahuje výkonu 1 EFLOPS. Jenže 1 EFLOPS superpočítačů je na světě pár a rozhodně se taková řešení nevyrábějí sériově. Kde je háček?

Výkon superpočítačů se tradičně uvádí pro univerzální výpočetní výkon při přesnosti FP64 / double-precision. To je v případě Hopper 30 TFLOPS na jedno GPU, takže by k dosažení 1 EFLOPS bylo zapotřebí zhruba 35 tisíc těchto čipů. Což samozřejmě sériově vyráběno nebude. Jak to tedy je?

Aby Nvidia mohla vydat ohromující tiskovou zprávu avizující 1 EFLOPS řešení (AMD má >1 EFLOPS superpočítač v provozu, druhý bude spuštěn letos, Intel spustí Auroru rovněž letos), poněkud přiohla terminologii a čísla. Pokud totiž hodnotu 1 EFLOPS vydělíme v tiskovce uvedeným počtem GPU (256), dostaneme se na údaj 4000 TFLOPS. Při pohledu do naší tabulky umístěné pod odstavcem už jste možná sami přišli na to, že této hodnoty GPU Hopper dosahuje, ale nikoli v univerzálním výpočetním výkonu, nikoli v přesnosti FP64 a nikoli v klasických výpočtech.

	AMD MI250X	AMD MI300	Nvidia Tesla V100	Nvidia A100		Nvidia H100
GPU	Aldebaran	Rigel	GV100	GA100		GH100
architektura	CDNA 2	CDNA 3	Volta	Ampere		Hopper
formát	OAM	OAM	SXM2	SXM4		SXM5
CU/SM	220	?	80	108		132
FP32 jader	14080	?	5120	6912		15872 16896
FP64 jader	-	-	2560	3456		8448
INT32 jader	-	-	5120	6912		8448
Tensor Cores	880	?	640	432		528
takt (boost)	1700 MHz	?	1530 MHz	1410 MHz		1980 MHz
	↓↓↓ T(FL)OPS ↓↓↓
FP16	383	?	31,4	78		120
BF16	383	?		39		120
FP32	95,7 47,8	?	15,7	19,5		60
FP64	47,8	?	7,8	9,7		30
INT4	383	?	?	?		?
INT8	383	?	?	?		?
INT16	?	?	?	?		?
INT32	?	?	15,7	19,5		30
FP8 tensor		?				2000/4000*
FP16 tensor	383	?	125	312/624*		1000/2000*
BF16 tensor	383	?		312/624*		1000/2000*
FP32 tensor	95,7	?		19,5		60?
TF32 tensor		?		156/312*		500/1000*
FP64 tensor	95,7	?		19,5		60
INT8 tensor	383	?		624/1248*		2000/4000*
INT4 tensor	?	?		1248/2496*		?
	↑↑↑ T(FL)OPS ↑↑↑
TMU	-^?	?	320	432		528
LLC	16 MB	?	6 MB	40 MB		50 MB
sběrnice	8192bit	?	4096bit	5120bit		5120bit
paměť	128 GB	128 GB	32 GB / 16 GB	40 GB	80 GB	80 GB
HBM	3,2 GHz	?	1,755 GHz	2,43 GHz	3,2 GHz	4,8 GHz
pam. prop.	3277 GB/s	?	900 GB/s	1555 GB/s	2048 GB/s	3072 GB/s
TDP	500 W 560 W	?	300 W	400 W		700 W
transistorů	58,2 mld.	?	21,1 mld.	54,2 mld.		80 mld.
plocha GPU	2× ?	4× ?	815 mm²	826 mm²		814 mm²
proces	6 nm	5nm	12 nm	7 nm		4nm
datum	11. 2021	2023	2017	5. 2020	11. 2020	2022-23

Hodnoty 4000 TFLOPS je dosahováno v přesnosti FP8 (tedy 8× nižší), pouze při tenzorových operacích a pouze při využití tzv. sparse neboli sparsity režimu. Ten lze uplatnit u výpočetních modelů, kde se předpokládá, že polovina dílčích výpočetních výsledků nebude mít na přesnost finálního výsledku příliš zásadní dopad a jako takové jsou tyto výpočty vynechané (proto je výsledný „výpočetní“ výkon dvojnásobný - vzdáleně to může připomínat DLSS).

Jaký tedy bude skutečný výpočetní výkon v jednotkách srovnatelných s ostatními superpočítači? 256 (GPU) × 30 (TFLOPS FP64) = 7680 TFLOPS = 7,68 PFLOS = 0,00768 EFLOPS.

Tagy:

superpočítač, Grace Hopper, Hopper, Nvidia

Zdroje:

Nvidia

nahlásit chybu

Jiří "no-X" Souček

více článků, blogů a informací o autorovi

Diskuse ke článku Nvidia uvádí DGX GH200 AI Supercomputer jako 1 EFLOPS řešení. Jenže…

Čtvrtek, 1 Červen 2023 - 00:57 | tombomino | ..kdyz se koukam na Kozenaka, tak nejak mam pocit...

Středa, 31 Květen 2023 - 18:00 | melkor | Je potřeba zákazníky patřičně motivovat ke koupi...

Středa, 31 Květen 2023 - 07:29 | skaven | k tomu ACE, co som videl z prezentacie, bolo to o...

Úterý, 30 Květen 2023 - 23:23 | DDR0 | první a první ve skoku na špek tendenčnímu článku...

Úterý, 30 Květen 2023 - 22:35 | melkor | Hodnota peněz. Díky ČNB, České koruně a českým...

Úterý, 30 Květen 2023 - 22:32 | melkor | miles, feets, square feets, pounds .. přibližná...

Úterý, 30 Květen 2023 - 21:46 | Kutil | Ty nejběžnější imperiální jednotky buď na pár...

Úterý, 30 Květen 2023 - 21:43 | Kutil | Padají peníze, tak moc?

Úterý, 30 Květen 2023 - 21:42 | Kutil | Tak si počtu.

Úterý, 30 Květen 2023 - 20:35 | Pjetro de | to sice moze byt pravda ze na AI je nieco ine,...

Zobrazit diskusi

Diit.cz - Novinky a informace o hardware, software a internetu

Nvidia uvádí DGX GH200 AI Supercomputer jako 1 EFLOPS řešení. Jenže…

Jiří "no-X" Souček

Diskuse ke článku Nvidia uvádí DGX GH200 AI Supercomputer jako 1 EFLOPS řešení. Jenže…

Komerční sdělení

CDR Hry

Epic rozdává zdarma hru, která potěší hráče adventur

Skandál: Zločinci zneužívali Starlink k obchodu s lidmi a finančním podvodům

Kód vygenerovaný AI má spoustu zranitelností: Odpovědnost padá na lidské týmy

Superpočítače odhalily záhadný signál z nitra Mléčné dráhy

OpenAI spustilo vlastní prohlížeč. Atlas ukazuje, že web už nebude stejný

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT