Instinct MI250X vyfocen, AMD získala zakázku francouzského superpočítače Adastra
Marketing AMD si nejspíš hlavu příliš neláme. V upoutávkách na akci Accelerated Data Center Premiere upustila AMD od značení „GPU“ v souvislosti s řadou Instinct a používala již výhradně označení akcelerátor. Pak ale při uvedení Instinct MI250X prezentovala jako první čipletové GPU. Buďto se marketingové oddělení AMD příliš netrápí s tím, jak vlastně produktu bude říkat, nebo možná situaci jen špatně chápu a označením „akcelerátor“ je míněn celým OAM modul, zatímco jako GPU v tomto kontextu figuruje pouzdro s křemíky.
Lisa Su sice na pódiu zvedla reálný kus hardwaru, ale záběr kamerou z dálky setřel veškeré detaily. Zveřejněná grafika pak obsahovala pouze rendery. Nyní tak máme možnost nahlédnout na první (o něco detailnější) fotografie duálního GPU Aldebaran a akcelerátoru Instinct MI250X (snad je to takto názvoslovně správně).
Leckdo se leckde pokoušel odvodit rozměry čipletů, problém však je, že použité HBM2E mají odlišné rozměry než klasické HBM2 (jsou o něco čtvercovější) a tyto rozměry neuvádějí ani výrobci, ani jiné zdroje. Kdo srovnával s rozměry klasických HBM2, dostal se k hausnumerům. Pokud bychom si chtěli udělat alespoň přibližný obrázek o ploše křemíku, nezbývá než vyjít z rozteče šroubů pro OAM modul (ta vnitřní čtveřice odpovídá 102 × 90 mm), z čehož se při použití úvodní fotografie dopočteme ploše asi 742 mm² pro křemík. Tato hodnota teoreticky může být mírně nadsazená. Fotka je totiž pořízena poměrně širokým ohniskem umocňujícím perspektivu, takže fakt, že křemík je fotosnímači blíž než otvory pro šrouby, může způsobit, že je zachycen jako trochu větší než ve skutečnosti. Nejspíš se ale pohybujeme někde kolem 700 mm², tedy na zhruba 1400 mm² 6nm křemíku celkem.
AMD Radeon Instinct MI60 | Instinct MI100 | Instinct MI250X | Instinct MI300 | Nvidia A100 | |
---|---|---|---|---|---|
GPU | Vega 20 | Arcturus | Aldebaran | Rigel | GA100 |
architektura | GCN 4 | CDNA | CDNA 2 | CDNA 3 | Ampere |
CPU | |||||
formát | PCIe | PCIe | OAM | SH5 | SXM4 / PCIe |
CU/SM | 60 | 120 | 220 (256) | (384-512?) | 108 |
FP32 jader | 3840 | 7680 | 14080 (16384) | (24k-33k?) | 6912 |
FP64 jader | - | - | - | - | 3456 |
INT32 jader | - | - | - | - | 6912 |
Tens. Cores | - | ? | 880 | ? | 432 |
takt | 1800 MHz | 1502 MHz | ≤1700 MHz | ? | 1410 MHz |
↓↓↓ T(FL)OPS ↓↓↓ | |||||
FP16 | 29,5 | 184,6 | 383 | ? | 78 |
BF16 | 92,3 | 383 | ? | 39 | |
FP32 | 14,7 | 23,5 | 95,7 47,9 | ? | 19,5 |
FP64 | 7,4 | 11,5 | 47,9 | ? | 9,7 |
INT4 | 118 | 184,6 | 383 | ? | ? |
INT8 | 59,0 | 184,6 | 383 | ? | ? |
INT16 | 29,5 | ? | ? | ? | ? |
INT32 | ? | ? | ? | ? | 19,5 |
FP16 tensor | 184,6 | 383 | ? | 312/624* | |
BF16 tensor | 92,3 | 383 | ? | 312/624* | |
FP32 tensor | 46,1 | 95,7 | ? | 19,5 | |
TF32 tensor | ? | 156/312* | |||
FP64 tensor | 95,7 | ? | 19,5 | ||
INT4 tensor | ? | 1248/2496* | |||
INT8 tensor | 184,6 | 383 | ? | 624/1248* | |
↑↑↑ T(FL)OPS ↑↑↑ | |||||
TMU | 240 | 480? | - | ? | 432 |
sběrnice | 4096bit | 4096bit | 8192bit | ? | 5120bit |
kapacita paměti | 32 GB | 32 GB | 128 GB | ? | 40 GB 80 GB |
HBM2 | 2,0 GHz | 2,4 GHz | 3,2 GHz | HBM3? | 2,43 GHz 3,20 GHz |
paměť. propustn. | 1024 GB/s | 1229 GB/s | 3277 GB/s | ? | 1555 GB/s 2048 GB/s |
TDP | 300 W | 300 W | 500W 560W | ~600W? | 400 / 250 W |
transistorů | 13,2 mld. | 50 mld. 25,6 mld. | 58,2 mld. | ? | 54,2 mld. |
plocha GPU | 331 mm² | 750 mm² | 2× ≤742mm² | ? | 826 mm² |
proces | 7 nm | 7 nm | 6nm | ? | 7 nm |
datum | 2018 | 2020 | 2021 | 2022-2023 | 2020 |
Ačkoli Aldebaran vznikl de facto na míru, aby AMD získala zakázku na superpočítač Frontier, má už společnost další objednávku. Získala smlouvu na superpočítač Adastra, který staví HPE pro Francii. Nejde sice o žádný EFLOPS systém, ale s plánovanými 70 PFLOPS stále půjde o jedno z nejvýkonnějších řešení v Evropě. Vznikne ve dvou vlnách. První HPE postaví na 3. generaci Epycu (Milan / Zen 3) a akcelerátorech Instinct MI250X. Druhá bude zkompletována později a bude vycházet z Epyců Genoa (Zen 4) chystaných na rok 2022.
AMD si v této souvislosti neodpustila připomenout, že meziročně stoupl počet systémů s jejím hardwarem v žebříčku Top500 zhruba na trojnásobek, konkrétně na 73 systémů. Z nejvýkonnějších deseti pohání čtyři, což je nejvíc ze všech výrobců procesorů a 2× více oproti druhému výrobci procesorů za AMD. 8 měsíců od vydání Epycu 3. generace (Milan) již tento procesor pohání 17 ze 73 superpočítačů postavených na hardwaru AMD.