Instinct MI300X má 750W TDP, MI300A je určen pro socket SH5
AMD tento týden představila Instinct MI300A, o kterém již bylo slyšet a který kombinuje procesorová jádra Zen 4 s výpočetními jádry CDNA 3, a dále Instinct MI300X, který nahrazuje procesorové čiplety dalšími výpočetními (CDNA 3), takže dosahuje vyššího aritmetického výkonu, ovšem potřebuje ještě nějaký procesor.
produkt | tranzistorů |
---|---|
AMD Instinct MI300X (Rigel-X?) | 153 miliard |
AMD Instinct MI300A (Rigel-A?) | 146 miliard |
Apple M2 Ultra (dual-die) | 134 miliard |
Apple M1 Ultra (dual-die) | 114 miliard |
Intel Xe-HPC / Ponte Vecchio | >100 miliard |
AMD Epyc (Genoa / Zen 4) | >90 miliard |
AMD Epyc (Bergamo / Zen 4c) | 82 miliard |
Nvidia H100 (Hopper) | 80 miliard |
Nvidia GeForce RTX 4090 / AD102 | 76,4 miliard |
AMD Instinct MI250X (Aldebaraan) | 58,2 miliard |
AMD Radeon RX 7900 XTX (Navi 31) | 57,7 miliard |
IBM Telum (dual-chip modul) | 45 miliard |
Power10 (dual-chip modul) | 36 miliard |
AWS Graviton2 | 30 miliard |
AMD Phoenix (APU) | >25 miliard |
Kombinovaný Instinct MI300A je vybaven 146 miliardami tranzistorů a je určen pro nadcházející socket SH5. Výpočetní Instinct MI300X je vybaven 153 miliardami tranzistorů a je určen (podobně jako předchozí Instinct) pro moduly OAM (OCP Accelerator Module). Modulový MI300X bude podle materiálů AMD mít nastavenu výchozí hodnotu TDP na 750 wattů.
Instinct MI100 | Instinct MI210 | Instinct MI250X | Instinct MI300A | Instinct MI300X | |
---|---|---|---|---|---|
označení | Arcturus | Aldebaran | Rigel | ||
architektura | CDNA | CDNA 2 | CDNA 3 | ||
CPU | 24× Zen 4 | ||||
formát | PCIe | PCIe | OAM | socket SH5 | OAM |
CU/SM | 120 | 104 (128) | 220 (256) | 384+? | ? |
FP32 jader | 7680 | 6656 (8192) | 14080 (16384) | 24k+? | ? |
FP64 jader | - | - | - | - | - |
INT32 jader | - | - | - | - | - |
Tens. Cores | 440? | 416 | 880 | ? | ? |
takt | 1502 MHz | ≤1700 MHz | ? | ? | |
↓↓↓ T(FL)OPS ↓↓↓ | |||||
FP16 | 184,6 | 181 | 383 | ? | ? |
BF16 | 92,3 | 181 | 383 | ? | ? |
FP32 | 23,5 | 45,3 22,6 | 95,7 47,9 | ? | ? |
FP64 | 11,5 | 22,6 | 47,9 | ? | ? |
INT4 | 184,6 | 181 | 383 | ? | ? |
INT8 | 184,6 | 181 | 383 | ? | ? |
INT16 | ? | ? | ? | ? | ? |
INT32 | ? | ? | ? | ? | ? |
FP8 tensor | 1500 3000* | ? | |||
FP16 tensor | 184,6 | 181 | 383 | 750? | ? |
BF16 tensor | 92,3 | 181 | 383 | 750? | ? |
FP32 tensor | 46,1 | 45,3 | 95,7 | 190? | ? |
TF32 tensor | ? | ? | |||
FP64 tensor | 45,3 | 95,7 | 190? | ? | |
INT4 tensor | ? | ? | |||
INT8 tensor | 184,6 | 181 | 383 | ? | ? |
↑↑↑ T(FL)OPS ↑↑↑ | |||||
TMU | 480? | - | - | - | |
sběrnice | 4096bit | 4096bit | 8192bit | 8192bit | |
kapacita paměti | 32 GB | 64 GB | 128 GB | 128 GB | 192 GB |
HBM | 2,4 GHz | 3,2 GHz | 3,2 GHz | HBM3 >5 GHz | |
paměť. propustn. | 1229 GB/s | 1639 GB/s | 3277 GB/s | 5,2 TB/s? | 5,2 TB/s |
TDP | 300 W | 300 W | 500W 560W | ? | 750W |
transistorů | 50 mld. 25,6 mld. | 29,1 mld. | 58,2 mld. | 146 mld. | 153 mld. |
plocha GPU | 750 mm² | 362 mm² | 724 mm² | 660 mm²? | |
proces | 7 nm | 6nm | 6nm | 5nm+6nm | |
datum | 2020 | 2022 | 2021 | Q3 2023? | Q4 2023? |
Tím se dostává nad 500-560 wattů předchozí generace (500 wattů pro standardní verzi, 560 wattů pro moduly určené superpočítači Frontier) a posouvá se na úroveň akcelerátorů generace Hopper od Nvidie, jejichž energetické nároky se pohybují kolem 700 wattů. Koncem roku tak nejspíš bude mít nejúspornější akcelerátory Intel v podobě dlouho odkládaného Ponte Vecchio. Tomu by mělo stačit 600 wattů, nicméně v důsledku zpoždění to Intel s jeho výkonnostní pozicí nebude mít snadné.