Instinct MI300X má 750W TDP, MI300A je určen pro socket SH5

16. 6. 2023 | no-X | Hardware, Novinky, Grafiky

Materiály AMD prozradily několik dalších detailů k nadcházejícím výpočetním čipům Instinct řady MI300, zejména pak TDP akcelerátoru Instinct MI300X…

AMD tento týden představila Instinct MI300A, o kterém již bylo slyšet a který kombinuje procesorová jádra Zen 4 s výpočetními jádry CDNA 3, a dále Instinct MI300X, který nahrazuje procesorové čiplety dalšími výpočetními (CDNA 3), takže dosahuje vyššího aritmetického výkonu, ovšem potřebuje ještě nějaký procesor.

produkt	tranzistorů
AMD Instinct MI300X (Rigel-X?)	153 miliard
AMD Instinct MI300A (Rigel-A?)	146 miliard
Apple M2 Ultra (dual-die)	134 miliard
Apple M1 Ultra (dual-die)	114 miliard
Intel Xe-HPC / Ponte Vecchio	>100 miliard
AMD Epyc (Genoa / Zen 4)	>90 miliard
AMD Epyc (Bergamo / Zen 4c)	82 miliard
Nvidia H100 (Hopper)	80 miliard
Nvidia GeForce RTX 4090 / AD102	76,4 miliard
AMD Instinct MI250X (Aldebaraan)	58,2 miliard
AMD Radeon RX 7900 XTX (Navi 31)	57,7 miliard
IBM Telum (dual-chip modul)	45 miliard
Power10 (dual-chip modul)	36 miliard
AWS Graviton2	30 miliard
AMD Phoenix (APU)	>25 miliard

Kombinovaný Instinct MI300A je vybaven 146 miliardami tranzistorů a je určen pro nadcházející socket SH5. Výpočetní Instinct MI300X je vybaven 153 miliardami tranzistorů a je určen (podobně jako předchozí Instinct) pro moduly OAM (OCP Accelerator Module). Modulový MI300X bude podle materiálů AMD mít nastavenu výchozí hodnotu TDP na 750 wattů.

	Instinct MI100	Instinct MI210	Instinct MI250X	Instinct MI300A	Instinct MI300X
označení	Arcturus	Aldebaran		Rigel
architektura	CDNA	CDNA 2		CDNA 3
CPU				24× Zen 4
formát	PCIe	PCIe	OAM	socket SH5	OAM
CU/SM	120	104 (128)	220 (256)	384+?	?
FP32 jader	7680	6656 (8192)	14080 (16384)	24k+?	?
FP64 jader	-	-	-	-	-
INT32 jader	-	-	-	-	-
Tens. Cores	440?	416	880	?	?
takt	1502 MHz		≤1700 MHz	?	?
	↓↓↓ T(FL)OPS ↓↓↓
FP16	184,6	181	383	?	?
BF16	92,3	181	383	?	?
FP32	23,5	45,3 22,6	95,7 47,9	?	?
FP64	11,5	22,6	47,9	?	?
INT4	184,6	181	383	?	?
INT8	184,6	181	383	?	?
INT16	?	?	?	?	?
INT32	?	?	?	?	?
FP8 tensor				1500 3000*	?
FP16 tensor	184,6	181	383	750?	?
BF16 tensor	92,3	181	383	750?	?
FP32 tensor	46,1	45,3	95,7	190?	?
TF32 tensor				?	?
FP64 tensor		45,3	95,7	190?	?
INT4 tensor				?	?
INT8 tensor	184,6	181	383	?	?
	↑↑↑ T(FL)OPS ↑↑↑
TMU	480^?	-	-	-
sběrnice	4096bit	4096bit	8192bit	8192bit
kapacita paměti	32 GB	64 GB	128 GB	128 GB	192 GB
HBM	2,4 GHz	3,2 GHz	3,2 GHz	HBM3 >5 GHz
paměť. propustn.	1229 GB/s	1639 GB/s	3277 GB/s	5,2 TB/s?	5,2 TB/s
TDP	300 W	300 W	500W 560W	?	750W
transistorů	50 mld. 25,6 mld.	29,1 mld.	58,2 mld.	146 mld.	153 mld.
plocha GPU	750 mm²	362 mm²	724 mm²	660 mm²?
proces	7 nm	6nm	6nm	5nm+6nm
datum	2020	2022	2021	Q3 2023?	Q4 2023?

Tím se dostává nad 500-560 wattů předchozí generace (500 wattů pro standardní verzi, 560 wattů pro moduly určené superpočítači Frontier) a posouvá se na úroveň akcelerátorů generace Hopper od Nvidie, jejichž energetické nároky se pohybují kolem 700 wattů. Koncem roku tak nejspíš bude mít nejúspornější akcelerátory Intel v podobě dlouho odkládaného Ponte Vecchio. Tomu by mělo stačit 600 wattů, nicméně v důsledku zpoždění to Intel s jeho výkonnostní pozicí nebude mít snadné.

Tagy: