AMD 6. prosince na akci Advancing AI zahájí prodeje Instinct MI300
Obě ohlášené varianty řady Instinct MI300 jsou prvními produkty AMD, které disponují více než 100 miliardami tranzistorů. V době vydání budou patřit k největším masově vyráběným čipům.
produkt | tranzistorů |
---|---|
AMD Instinct MI300X (Rigel-X?) | 153 miliard |
AMD Instinct MI300A (Rigel-A?) | 146 miliard |
Apple M2 Ultra (dual-die) | 134 miliard |
Apple M1 Ultra (dual-die) | 114 miliard |
Intel Xe-HPC / Ponte Vecchio | >100 miliard |
AMD Epyc (Genoa / Zen 4) | >90 miliard |
AMD Epyc (Bergamo / Zen 4c) | 82 miliard |
Nvidia H100 (Hopper) | 80 miliard |
Nvidia GeForce RTX 4090 / AD102 | 76,4 miliard |
AMD Instinct MI250X (Aldebaraan) | 58,2 miliard |
AMD Radeon RX 7900 XTX (Navi 31) | 57,7 miliard |
IBM Telum (dual-chip modul) | 45 miliard |
Power10 (dual-chip modul) | 36 miliard |
AWS Graviton2 | 30 miliard |
AMD Phoenix (APU) | >25 miliard |
Instinct MI300A tvoří kombinace CDNA 3 a Zen 4 čipletů, takže jde o procesor / APU / SoC, samostatně fungující jednotku, která integruje procesorová i výpočetní jádra. Výhodou taktového řešení jsou podstatně nižší požadavky na prostor i na chladiče (prostor běžně využitý procesory a jejich chladiči lze využít pro další SoC). Tuto konfiguraci dodává AMD od června pro superpočítač El Capitan.
Instinct MI300X tvoří čistě CDNA 3 čiplety, takže jde o klasický samostatný akcelerátor, kterým (prostřednictvím OAM rozhraní) doplní výrobce systému procesorem osazenou desku.
Instinct MI100 | Instinct MI210 | Instinct MI250X | Instinct MI300A | Instinct MI300X | |
---|---|---|---|---|---|
označení | Arcturus | Aldebaran | Rigel | ||
architektura | CDNA | CDNA 2 | CDNA 3 | ||
CPU | 24× Zen 4 | ||||
formát | PCIe | PCIe | OAM | socket SH5 | OAM |
CU/SM | 120 | 104 (128) | 220 (256) | 384+? | ? |
FP32 jader | 7680 | 6656 (8192) | 14080 (16384) | 24k+? | ? |
FP64 jader | - | - | - | - | - |
INT32 jader | - | - | - | - | - |
Tens. Cores | 440? | 416 | 880 | ? | ? |
takt | 1502 MHz | ≤1700 MHz | ? | ? | |
↓↓↓ T(FL)OPS ↓↓↓ | |||||
FP16 | 184,6 | 181 | 383 | ? | ? |
BF16 | 92,3 | 181 | 383 | ? | ? |
FP32 | 23,5 | 45,3 22,6 | 95,7 47,9 | ? | ? |
FP64 | 11,5 | 22,6 | 47,9 | ? | ? |
INT4 | 184,6 | 181 | 383 | ? | ? |
INT8 | 184,6 | 181 | 383 | ? | ? |
INT16 | ? | ? | ? | ? | ? |
INT32 | ? | ? | ? | ? | ? |
FP8 tensor | 1500 3000* | ? | |||
FP16 tensor | 184,6 | 181 | 383 | 750? | ? |
BF16 tensor | 92,3 | 181 | 383 | 750? | ? |
FP32 tensor | 46,1 | 45,3 | 95,7 | 190? | ? |
TF32 tensor | ? | ? | |||
FP64 tensor | 45,3 | 95,7 | 190? | ? | |
INT4 tensor | ? | ? | |||
INT8 tensor | 184,6 | 181 | 383 | ? | ? |
↑↑↑ T(FL)OPS ↑↑↑ | |||||
TMU | 480? | - | - | - | |
sběrnice | 4096bit | 4096bit | 8192bit | 8192bit | |
kapacita paměti | 32 GB | 64 GB | 128 GB | 128 GB | 192 GB |
HBM | 2,4 GHz | 3,2 GHz | 3,2 GHz | HBM3 >5 GHz | |
paměť. propustn. | 1229 GB/s | 1639 GB/s | 3277 GB/s | 5,2 TB/s? | 5,2 TB/s |
TDP | 300 W | 300 W | 500W 560W | ? | 750W |
transistorů | 50 mld. 25,6 mld. | 29,1 mld. | 58,2 mld. | 146 mld. | 153 mld. |
plocha GPU | 750 mm² | 362 mm² | 724 mm² | 660 mm²? | |
proces | 7 nm | 6nm | 6nm | 5nm+6nm | |
datum | 2020 | 2022 | 2021 | 2023 | 2023 |
Zveřejnění podrobných specifikací a uvedení obou modelů chystá AMD na akci Advancing AI ohlášenou na středu 6. prosince. Podle neoficiálních zdrojů bude toto datum zároveň i vydáním, jinými slovy zahájením distribuce i pro ostatní zákazníky.
AMD se doposud oficiálně nezmínila o modelu Instinct MI300C, který má podle některých zdrojů v laboratořích. Tato varianta postrádá CDNA 3 jádra a stojí čistě na x86 jádrech Zen 4 doplněných HBM3 pamětí jako ostatní modely. Je možné, že tato verze bude vydaná později nebo vůbec, neboť cílí na specifičtější segment (procesorová akcelerace jazykových modelů), menší část trhu. Je možné, že její případné vydání bude záviset i na celkových výrobních kapacitách a jejich využití hlavními modely Instinct MI300A a MI300X.