AMD MI300: čtyři 6nm GPU-čiplety, integrovaný procesor, SH5 socket
Když se objevily první zmínky o třetí generaci výpočetní architektury CDNA, byly provázeny zvěstmi o době vydání 2023-2024. V posledních měsících však přicházejí informace posouvající datum vydání do podstatně bližší doby. Podle listopadových zpráv má být Rigel, jak se SoC / APU jmenuje, dodáván již v letošním (2022) roce, aby ke kompletaci počítače El Capitan mohlo být přistoupeno zhruba kolem přelomu roku 2022 / 2023 a začátkem roku 2023 má být systém kompletní, spuštěný a předaný.
Nyní se z Linked In profilu inženýra Brian Walters (který se podílí na vývoji rozhraní Infinity Fabric) dozvídáme, že Rigel / MI300 bude 6nm produkt. Využití procesu, na němž byla AMD schopna s vysokou výtěžností vyrábět ~700mm² čipy již v loňském roce, koresponduje s informacemi o záměru (relativně) časné výroby tohoto produktu. Jak již víme ze starších zpráv, výpočetní („GPU“) čiplety budou čtyři. Podle leakera Bondrewd ale pouzdro nese i další čiplety. To pro změnu koresponduje se zprávami, že Rigel bude oproti předchozím produktům řady Instinct integrovat i CPU. Zároveň by to mohlo indikovat, že procesorová jádra nebudou integrována v samotných grafických čipletech, ale budou nejspíš v návrhu figurovat jako samostatné kousky křemíku. Tím pádem by mohly být vyráběné na odlišném procesu. Z hlediska smysluplnosti a pravděpodobnosti se nabízí 5nm čiplety se Zen 4.
AMD Radeon Instinct MI60 | Instinct MI100 | Instinct MI250X | Instinct MI300 | Nvidia A100 | |
---|---|---|---|---|---|
GPU | Vega 20 | Arcturus | Aldebaran | Rigel | GA100 |
architektura | GCN 4 | CDNA | CDNA 2 | CDNA 3 | Ampere |
CPU | |||||
formát | PCIe | PCIe | OAM | SH5 | SXM4 / PCIe |
CU/SM | 60 | 120 | 220 (256) | (384-512?) | 108 |
FP32 jader | 3840 | 7680 | 14080 (16384) | (24k-33k?) | 6912 |
FP64 jader | - | - | - | - | 3456 |
INT32 jader | - | - | - | - | 6912 |
Tens. Cores | - | ? | 880 | ? | 432 |
takt | 1800 MHz | 1502 MHz | ≤1700 MHz | ? | 1410 MHz |
↓↓↓ T(FL)OPS ↓↓↓ | |||||
FP16 | 29,5 | 184,6 | 383 | ? | 78 |
BF16 | 92,3 | 383 | ? | 39 | |
FP32 | 14,7 | 23,5 | 95,7 47,9 | ? | 19,5 |
FP64 | 7,4 | 11,5 | 47,9 | ? | 9,7 |
INT4 | 118 | 184,6 | 383 | ? | ? |
INT8 | 59,0 | 184,6 | 383 | ? | ? |
INT16 | 29,5 | ? | ? | ? | ? |
INT32 | ? | ? | ? | ? | 19,5 |
FP16 tensor | 184,6 | 383 | ? | 312/624* | |
BF16 tensor | 92,3 | 383 | ? | 312/624* | |
FP32 tensor | 46,1 | 95,7 | ? | 19,5 | |
TF32 tensor | ? | 156/312* | |||
FP64 tensor | 95,7 | ? | 19,5 | ||
INT4 tensor | ? | 1248/2496* | |||
INT8 tensor | 184,6 | 383 | ? | 624/1248* | |
↑↑↑ T(FL)OPS ↑↑↑ | |||||
TMU | 240 | 480? | - | ? | 432 |
sběrnice | 4096bit | 4096bit | 8192bit | ? | 5120bit |
kapacita paměti | 32 GB | 32 GB | 128 GB | ? | 40 GB 80 GB |
HBM2 | 2,0 GHz | 2,4 GHz | 3,2 GHz | HBM3? | 2,43 GHz 3,20 GHz |
paměť. propustn. | 1024 GB/s | 1229 GB/s | 3277 GB/s | ? | 1555 GB/s 2048 GB/s |
TDP | 300 W | 300 W | 500W 560W | ~600W? | 400 / 250 W |
transistorů | 13,2 mld. | 50 mld. 25,6 mld. | 58,2 mld. | ? | 54,2 mld. |
plocha GPU | 331 mm² | 750 mm² | 2× ≤742mm² | ? | 826 mm² |
proces | 7 nm | 7 nm | 6 nm | 6 nm | 7 nm |
datum | 2018 | 2020 | 2021 | 2022-2023 | 2020 |
Další změnou (nyní potvrzenou dalším zdrojem) je odlišný koncept platformy. Zatímco řada Aldebaran / MI200 cílila primárně na OAM moduly, Rigel / MI300 je primárně socketové řešení. Socket SH5 tak nejspíš bude jedním z největších socketů. Čtyři ~700milimetrové grafické křemíky, čtyři až osm procesorových křemíků (podle toho, zda budou osmi- nebo šestnáctijádrové) a k tomu HBM paměti, vychází v součtu na pořádné pouzdro.
Exascale Heterogeneous Processor (EHP), koncept z roku 2017
I v případě, že by HBM paměti byly položeny na GPU-čipletech (podle konceptu „Exascale Heterogeneous Processor“ neboli EHP z roku 2017), by stále šlo o skutečně velké LGA rozhraní. Při růstu množství odpadního tepla v důsledku pomalejšího (než dříve očekávaného) vývoje výrobních procesů je však možné, že HBM budou umístěny klasicky vedle čipletů. Což by zároveň mohlo vysvětlovat, proč jsou GPU-čiplety přítomny v počtu čtyř a nikoli po osmi (jako na schématu).
Pokud bude situace obdobná jako u generace MI200, kterou AMD formálně uvedla až řadu měsíců po zahájení dodávek na stavbu superpočítačů, je možné, že k formálnímu vydání dojde opět koncem roku (2022), případně začátkem roku 2023 (lednový CES by se však pro hardware tohoto typu hodil méně). V reálném konkurenčním prostředí bude stát Rigel / MI300 proti Hopper od Nvidie (představení má proběhnout letos na jaře) a Ponte Vecchio (Xe HPC), se kterým se Intel chlubí již od Vánoc 2019.
Diskuse ke článku AMD MI300: čtyři 6nm GPU-čiplety, integrovaný procesor, SH5 socket