Diit.cz - Novinky a informace o hardware, software a internetu

AMD Instinct MI300 naroste na 4 čiplety

AMD už připravuje nástupce výpočetního GPU Aldebaran / Instinct MI200. Počet čipletů stoupne na dvojnásobek, takže lze očekávat rovnou čtyři. Nejspíš adekvátně tomu vzroste i výkon…

AMD v současnosti prodává Radeon Instinct MI100 s GPU Arcturus. Mezi tím, od letošního jara, dodává partnerským firmám vzorky Instinct MI200 s GPU Aldebaran. Ten přináší několik zásadních odlišností. Jednak z názvu vypadlo slovo „Radeon“. Jednak půjde o první čipletové GPU vůbec. A jednak půjde patrně o první GPU s nativní full-rate podporou double-precision. To znamená, že celkový aritmetický výkon v FP64 nebude poloviční (oproti FP32), ale totožný.

S formálním vydáním Instinct MI200 AMD nechvátá, nemá totiž důvod. Produkt vznikl primárně kvůli zakázkám na velké superpočítače (EFLOPS éra), které AMD získala, a primárně bude těmito akcelerátory vybavovat je. Teprve po jejich pokrytí, až půjdou akcelerátory do prodeje, dojde k formálnímu vydání - pravděpodobně na samém konci letošního roku. Od MI200 se očekává, že každý z obou čipletů bude vybaven podobným počtem stream-procesorů jako jededn čip MI100, takže hrubý výkon bude téměř dvojnásobný. Formáty, jejichž implementace bude rozšířena (např. zmíněný FP64), budou podporovány o 2× vyšším výkonu na výpočetní jednotku a tudíž celkem o téměř 4× vyšší výkonu ve srovnání s MI100. Jde sice o neoficiální informace, nicméně by to odpovídalo dalším známým údajům jako je použití dvou čipletů, 4× vyšší kapacita paměti, 3× vyšší propustnost pamětí a přechod z formátu dvouslotové PCIe karty (250-300W TDP) na OAM modul (možnost 600W i vyššího TDP).

 AMD Radeon
Instinct MI60
Instinct
MI100
Instinct
MI200
Instinct
MI300
Nvidia A100
GPUVega 20ArcturusAldebaranRigelGA100
architekturaGCN4CDNACDNA2CDNA3Ampere
formátPCIePCIeOAMOAMSXM4 / PCIe
CU/SM60120240
(256)
(384-512?)108
FP32 jader3840768015360
(16384)
(24k-33k?)6912
FP64 jader----3456
INT32 jader----6912
Tensor Cores-???432
takt1800 MHz1502 MHz≤1500 MHz?1410 MHz
 ↓↓↓ T(FL)OPS ↓↓↓
FP16
29,5184,6369?78
BF16
92,3185?39
FP32
14,723,592,3?19,5
FP64
7,411,546,1?9,7
INT4
118184,6???
INT859,0
184,6???
INT1629,5????
INT32????19,5
FP16 tensor184,6369?312/624*
BF16 tensor92,3369?312/624*
FP32 tensor46,192,3?19,5
TF32 tensor
?156/312*
FP64 tensor
46,1??19,5
INT8 tensor
184,6369?624/1248*
INT4 tensor
?1248/2496*
 ↑↑↑ T(FL)OPS ↑↑↑
TMU240480?960?
(1024)?
?432
sběrnice4096bit4096bit8192bit?5120bit
kapacita paměti32 GB32 GB≤128 GB?40 GB
80 GB
HBM22,0 GHz2,4 GHz3,2 GHzHBM3?2,43 GHz
3,20 GHz
pam. propustn.1024 GB/s1229 GB/s3277 GB/s 1555 GB/s
2048 GB/s
TDP300 W300 W≤600W?~600W?400 / 250 W
transistorů13,2 mld.50,0 mld.
>100 mld.??54,2 mld.
plocha GPU331 mm²750 mm²
??826 mm²
proces (TSMC)7 nm7 nm??7 nm N7
datum2018202020212022-20232020

Podle aktuálních informací ale už běží práce na Instinct MI300 (zda se karta skutečně bude takto jmenovat, zatím není potvrzeno, prostě půjde o další generaci). Ta by měla být vybavena čtveřicí čipletů. Zdá se, že podobně jako u MI200 budou i u MI300 čiplety symetrické (což je rozdíl oproti desktopovým grafickým čipům, kde to alespoň zatím vypadá na dva typy čipletů, kdy jeden - obsahující Infinity Cache a paměťové rozhraní - bude zároveň sloužit jako propojka čipletů s výpočetními bloky).

Krom počtu čipletů zatím nejsou další parametry MI300 známé, ale leccos lze odvodit. Dá se očekávat, že zůstane fyzicky 128 CU / 4096 stream-procesorů na čiplet, část bude deaktivovaná a opět dojde k rozšíření podpory datových formátů, takže by u některých mohl být výkon navýšen více, než by odpovídalo prostému zvýšení počtu stream-procesorů. O čem můžeme jen spekulovat bez jakékoli pevné půdy pod nohama, je výrobní proces. Důvodem je, že není známé ani to, na jakém vznikne současný MI200. Některé zdroje tvrdí, že na 7nm (což je možné s ohledem na volbu formátu, který umožňuje citelné zvýšení TDP), ovšem jiné se k tomutu tématu nevyjadřují vůbec. Pro MI300 by pak připadaly v úvahu možnosti 5nm procesem počínaje, přes 4nm až po 3nm. Opět bude záležet, kdy má být akcelerátor vydaný. Některé zdroje hovoří o dvou letech po MI200, ovšem MI200 přichází rok po MI100 (což by mohlo značit, že MI300 dorazí dříve než po dvou letech).

Ať už bude MI300 hotový v roce 2022 nebo 2023, půjde s ohledem na výkon očekávatelný ze čtyř čipletů o neméně ambiciózní posun než byl / je / bude MI100 -> MI200. Bude-li se AMD držet dosavadního schematu kódových jmen podle velkých hvězd, měl by po Arcturu (MI100) a Aldebaranu  (MI200) následovat Rigel (úvodní ilustrace). Ten také bývá nazvývaný jako Beta Orionis - podle souhvězdí Orion, v němž je nejjasnější hvězdou.

Tagy: 
Zdroje: 

Diskuse ke článku AMD Instinct MI300 naroste na 4 čiplety

Pátek, 10 Září 2021 - 18:05 | Lazar | Predpokladal bych, ze MI200-based akcelerator...
Pátek, 10 Září 2021 - 07:38 | snajprik | Na tych kartach by sa pekne ťažilo, možno aj 30€...
Pátek, 10 Září 2021 - 07:16 | del42sa | v té tabulce je chyba. Vega není GCN4
Pátek, 10 Září 2021 - 05:42 | Peter Fodrek | Aj s Xilixom to vyerá lepšie a možno niečo...

Zobrazit diskusi