Diit.cz - Novinky a informace o hardware, software a internetu

AMD vydává Instinct MI300X, nejrychlejší AI akcelerátor na světě

Zdroj: AMD

Na akci Advancing AI vydala Lisa Su Instinct MI300X. Systémy lze objednávat u Dellu, HP, Lenova, SuperMicro a dalších. Výpočetní AI APU Instinct MI300A se přesouvá do fáze velkokapacitní výroby…

CEO AMD Lisa Su na dvouhodinové prezentaci Advancing AI oficiálně uvedla Instinct MI300X a za asistence Forresta Norroda i Instinct MI300A. Jak už asi víte, Instinct MI300X je čistě akcelerátor v OAM formátu, Instinct MI300A je AI/výpočetní APU - integruje i procesorová jádra - pro socket SH5.

Instinct MI300X a Instinct MI300A (AMD)

Oba produkty sdílí čtyři základní čiplety, které zajišťují spojení funkčních čipletů, komunikaci s HBM3 pamětmi o 8192bit sběrnici a integrují celkem 256 MB Infinity Cache. Oproti 16 MB cache u Instinct MI250X jde o obrovský (šestnáctinásobný) posun a i ve srovnání s Nvidia Hopper (40 MB) jde o řádově více. Základní 6nm čiplety nesou funkční 5nm čiplety a to celkem 8 CDNA 3 čipletů v případě MI300X a 6 CDNA + 3 Zen 4 čiplety (tj. 24 jader) v případě MI300A.

 Instinct
MI100
Instinct
MI210
Instinct
MI250X
Instinct
MI300A
Instinct
MI300X
označeníArcturusAldebaranRigel
architekturaCDNACDNA 2CDNA 3
CPU24× Zen 4
formátPCIePCIeOAMsocket SH5OAM
CU/SM120104
(128)
220
(256)
228304
FP32 jader76806656
(8192)
14080
(16384)
1459219456
FP64 jader-----
INT32 jader-----
Tens. Cores440?416880??
takt (max.)1502 MHz 1700 MHz2100 MHz
 ↓↓↓ T(FL)OPS ↓↓↓
FP16
184,6181383980,61300
BF16
92,3181383980,61300
FP32
23,545,3
22,6
95,7
47,9
122,6163,4
FP64
11,522,647,961,381,7
INT4
184,6181383??
INT8184,618138319602600
INT16?????
INT32?????
FP8 tensor3922,4*
1961,2
5229,8*
2614,9
FP16 tensor184,61813831961,2*
980,6
2614,9*
1307,5
BF16 tensor92,31813831961,2*
980,6
2614,9*
1307,5
FP32 tensor46,145,395,7122,6163,4
TF32 tensor
980,6*
490,3
1307,4*
653,7
FP64 tensor
45,395,7122,6163,4
INT4 tensor
INT8 tensor
184,61813833922,4*
1961,2
5229,8*
2614,9
 ↑↑↑ T(FL)OPS ↑↑↑
TMU480?---
cache??16 MB256 MB Infinity Cache
sběrnice4096bit4096bit8192bit8192bit
kapacita
paměti
32 GB64 GB128 GB128 GB192 GB
HBM2,4 GHz3,2 GHz3,2 GHzHBM3 >5 GHz
paměť.
propustn.
1229 GB/s1639 GB/s3277 GB/s5,3 TB/s
TDP300 W300 W500W
560W
550-760W750W
transistorů50 mld.
25,6 mld.
29,1 mld.58,2 mld.146 mld.153 mld.
plocha GPU750 mm²
362 mm²724 mm²660 mm²?
proces7 nm6nm6nm5nm+6nm
datum20202022202120232023

*sparsity

Přibyla podpora formátů FP8, TF32 a sparsity. Výpočetní výkon u většiny typů přesnosti mezigeneračně stoupl mnohonásobně. V případě AI výpočtů v FP16 jde o 3,4násobek, v případě využití sparsity na 6,8násobek. U formátu FP8, který předchozí generace nepodporovala (i když nebyla vyšší přesnost potřebná, musely výpočty běžet v FP16), jde o 6,8násobek v základu a 13,7násobek při použití sparsity.

Velký posun v reálné zátěži přinesla šestá generace softwarové platformy ROCm, která mezigenerační posun výkonu (inference) navýšila až na osminásobek.

V reálné zátěži AMD prezentuje Instinct MI300X jako srovnatelně výkonný s Nvidia (Hopper) H100 pro tréning a 1,4-1,6× rychlejší pro inferenci.

Podstatné rozdíly v možnosti využití přináší vyšší rychlost i kapacita HBM paměti v kombinaci s Infinity Cache. Instinct MI300X umožňuje běh 2× větších modelů než Nvidia H100, případně dvojnásobku modelů zároveň oproti Nvidia H100. Instinct MI300X dále nabízí 2,4× vyšší výpočetní výkon ve vektorových (FP32, FP64) výpočtech.

V případě Instinct MI300A jsou tato čísla o něco nižší (čtvrtinu CDNA 3 čipletů nahrazují x86 jádra): oproti Nvidia H100 je výkon ve vektorových výpočtech 1,8× vyšší a v testu OpenFOAM dosahuje Instinct MI300A podle testů AMD 4× vyššího výkonu než H100.

Za velkou částí tohoto náskoku stojí unifikovaná paměť (HBM3 společná pro procesorová i výpočetní jádra), zatímco Nvidia H100 musí data přenášet z operační paměti do akcelerátoru, což brzdí pomalejší PCIe rozhraní. Desítky procent z náskoku pak jdou na vrub kapacitě paměti a propustnosti, které asistuje 256MB Infinity Cache.

Díky tomu pak ve výpočetní zátěži dosahuje Instinct MI300A 2× vyšší energetické efektivity než procesorovo-akcelerační řešení Nvidie, Grace Hopper (ARM CPU + Hopper GPU).

Systémy s akcelerátoy Instinct MI300X již má v nabídce Dell, HP, Lenovo, SuperMicro a další. Systémy s Instinct MI300A budou dostupné u HP, Eviden, Gigabyte a SuperMicro.

Diskuse ke článku AMD vydává Instinct MI300X, nejrychlejší AI akcelerátor na světě

Pondělí, 11 Prosinec 2023 - 13:07 | Ladis | Pokud se musíš ptát, tak není pro tebe ;-) Ale...
Pondělí, 11 Prosinec 2023 - 12:24 | eXponencial | kolko stoji taky jeden MI300X ?
Pondělí, 11 Prosinec 2023 - 12:21 | eXponencial | takze aj do EU ?
Sobota, 9 Prosinec 2023 - 09:52 | hajčus | Kdákání ruské propagandy není žádný "vlastní...
Pátek, 8 Prosinec 2023 - 19:56 | Jirka1 | Myslíš tím tu tvou "ruskou" realitu?
Pátek, 8 Prosinec 2023 - 18:46 | Zdenek | Jejda za fakta se tu dávají mínusy holt pravda a...
Pátek, 8 Prosinec 2023 - 18:44 | Zdenek | Jestli to bylo na mě tak mi to zrovna od tebe je...
Pátek, 8 Prosinec 2023 - 17:53 | hajčus | Z toho vyplývá, že jsi nevzdělaný a neznáš...
Pátek, 8 Prosinec 2023 - 16:10 | peliculiar | Mirdo, 100x raději budu "libtardem",...
Pátek, 8 Prosinec 2023 - 15:57 | peliculiar | @ Pety: Doporučil bych ti zkusit dát šanci i...

Zobrazit diskusi