8. 11. na Accelerated Data Center Premiere uvede AMD Instinct MI200 a nové Epycy
V pondělí 8. listopadu vystoupí na Accelerated Data Center Premiere CEO AMD Lisa Su, šéf divize pro datacentra Forrest Norrod a šéf serverů Dan McNamara, aby představili nějaké novinky. Oficiálně nebylo ohlášeno, o jaké produkty půjde, ale podle leakerů se AMD chystá představit architekturu CDNA 2 a na ní postavené akcelerátory z rodiny Instinct MI200 (MI250 a MI250X) a dále některou z procesorových novinek vycházejících ze Zen 3 - buďto Milan-X (tedy Zen 3 s V-cache pro servery) nebo Trento (serverový Zen 3 s podporou Unified Memory Architecture).
V souvislosti s těmito plány se objevily další upřesňující informace k akcelerátorům Instinct. První je spíše marketingového ražení: AMD u výpočetních GPU upouští od používání termínu GPU. Jde k akcelerátory. Tato změna však není neopodstatněná: CDNA 2 již neobsahuje žádné fixní jednotky sloužící k akceleraci 3D grafiky. Chybí rasterizér, chybějí texturovací jednotky, chybějí ROP, chybí akcelerátory pro ray-tracing. Zůstává jen multimediální obvod pro akceleraci videa. Některé zdroje tvrdily, že fixní jednotky pro 3D grafiku chyběly již u CDNA (1), podle jiných alespoň některé přítomny byly. Každopádně s CDNA 2 jsou minulostí.
AMD Radeon Instinct MI60 | Instinct MI100 | Instinct MI250X | Instinct MI300 | Nvidia A100 | |
---|---|---|---|---|---|
GPU | Vega 20 | Arcturus | Aldebaran | Rigel | GA100 |
architektura | GCN 4 | CDNA | CDNA 2 | CDNA 3 | Ampere |
CPU | |||||
formát | PCIe | PCIe | OAM | OAM | SXM4 / PCIe |
CU/SM | 60 | 120 | 220 (256) | (384-512?) | 108 |
FP32 jader | 3840 | 7680 | 14080 (16384) | (24k-33k?) | 6912 |
FP64 jader | - | - | - | - | 3456 |
INT32 jader | - | - | - | - | 6912 |
Tens. Cores | - | ? | ? | ? | 432 |
takt | 1800 MHz | 1502 MHz | ≤1700 MHz | ? | 1410 MHz |
↓↓↓ T(FL)OPS ↓↓↓ | |||||
FP16 | 29,5 | 184,6 | 383 | ? | 78 |
BF16 | 92,3 | 383 | ? | 39 | |
FP32 | 14,7 | 23,5 | 95,7 | ? | 19,5 |
FP64 | 7,4 | 11,5 | 47,9 | ? | 9,7 |
INT4 | 118 | 184,6 | ? | ? | ? |
INT8 | 59,0 | 184,6 | ? | ? | ? |
INT16 | 29,5 | ? | ? | ? | ? |
INT32 | ? | ? | ? | ? | 19,5 |
FP16 tensor | 184,6 | 383? | ? | 312/624* | |
BF16 tensor | 92,3 | 383? | ? | 312/624* | |
FP32 tensor | 46,1 | 95,7 | ? | 19,5 | |
TF32 tensor | ? | 156/312* | |||
FP64 tensor | 47,9? | ? | 19,5 | ||
INT8 tensor | 184,6 | 383? | ? | 624/1248* | |
INT4 tensor | ? | 1248/2496* | |||
↑↑↑ T(FL)OPS ↑↑↑ | |||||
TMU | 240 | 480? | - | ? | 432 |
sběrnice | 4096bit | 4096bit | 8192bit | ? | 5120bit |
kapacita paměti | 32 GB | 32 GB | 128 GB | ? | 40 GB 80 GB |
HBM2 | 2,0 GHz | 2,4 GHz | 3,2 GHz | HBM3? | 2,43 GHz 3,20 GHz |
paměť. propustn. | 1024 GB/s | 1229 GB/s | 3277 GB/s | ? | 1555 GB/s 2048 GB/s |
TDP | 300 W | 300 W | 500W | ~600W? | 400 / 250 W |
transistorů | 13,2 mld. | 50,0 mld. | >100 mld.? | ? | 54,2 mld. |
plocha GPU | 331 mm² | 750 mm² | ? | ? | 826 mm² |
proces | 7 nm | 7 nm | 7nm? | ? | 7 nm |
datum | 2018 | 2020 | 2021 | 2022-2023 | 2020 |
Nově (byť stále neoficiálně) „potvrzené“ hodnoty jsou zvýrazněny tučně, výraznější změny červeně
Dále se vyjasňuje situace s podporou formátu FP32. CDNA vůbec jako první architektura vycházející z GPU nativně podporuje formát FP64 v plné rychlosti. Zdroje však byly nejednotné co do rychlosti podpory FP32. CDNA 2 podporuje packed-FP32, což znamená zpracování FP32:FP64 2:1, jinými slovy Instinct MI250X bude dosahovat až 95,7 TFLOPS v FP32. Výkon v FP64, FP32 a FP16 je tedy oproti Nvidia A100 pětinásobný, výkon ve formátu BF16 nejspíš desetinásobný.
Paradoxně ač je o akcelerátorech řady MI200 známo vše podstatné, o procesorech zatím neuniklo prakticky nic nového a buďto se tedy AMD daří držet tyto novinky pod pokličkou lépe, nebo bude důraz akce kladen na akcelerátory.