Diit.cz - Novinky a informace o hardware, software a internetu

8. 11. na Accelerated Data Center Premiere uvede AMD Instinct MI200 a nové Epycy

Za necelé dva týdny proběhne akce Accelerated Data Center Premiere na které AMD představí několik novinek orientovaných na servery, výpočetní stanice, AI systémy a datacentra…

V pondělí 8. listopadu vystoupí na Accelerated Data Center Premiere CEO AMD Lisa Su, šéf divize pro datacentra Forrest Norrod a šéf serverů Dan McNamara, aby představili nějaké novinky. Oficiálně nebylo ohlášeno, o jaké produkty půjde, ale podle leakerů se AMD chystá představit architekturu CDNA 2 a na ní postavené akcelerátory z rodiny Instinct MI200 (MI250 a MI250X) a dále některou z procesorových novinek vycházejících ze Zen 3 - buďto Milan-X (tedy Zen 3 s V-cache pro servery) nebo Trento (serverový Zen 3 s podporou Unified Memory Architecture).

V souvislosti s těmito plány se objevily další upřesňující informace k akcelerátorům Instinct. První je spíše marketingového ražení: AMD u výpočetních GPU upouští od používání termínu GPU. Jde k akcelerátory. Tato změna však není neopodstatněná: CDNA 2 již neobsahuje žádné fixní jednotky sloužící k akceleraci 3D grafiky. Chybí rasterizér, chybějí texturovací jednotky, chybějí ROP, chybí akcelerátory pro ray-tracing. Zůstává jen multimediální obvod pro akceleraci videa. Některé zdroje tvrdily, že fixní jednotky pro 3D grafiku chyběly již u CDNA (1), podle jiných alespoň některé přítomny byly. Každopádně s CDNA 2 jsou minulostí.

 AMD Radeon
Instinct MI60
Instinct
MI100
Instinct
MI250X
Instinct
MI300
Nvidia A100
GPUVega 20ArcturusAldebaranRigelGA100
architekturaGCN 4CDNACDNA 2CDNA 3Ampere
CPU
formátPCIePCIeOAMOAMSXM4 / PCIe
CU/SM60120220
(256)
(384-512?)108
FP32 jader3840768014080
(16384)
(24k-33k?)6912
FP64 jader----3456
INT32 jader----6912
Tens. Cores-???432
takt1800 MHz1502 MHz≤1700 MHz?1410 MHz
 ↓↓↓ T(FL)OPS ↓↓↓
FP16
29,5184,6383?78
BF16
92,3383?39
FP32
14,723,595,7?19,5
FP64
7,411,547,9?9,7
INT4
118184,6???
INT859,0
184,6???
INT1629,5????
INT32????19,5
FP16 tensor184,6383??312/624*
BF16 tensor92,3383??312/624*
FP32 tensor46,195,7
?19,5
TF32 tensor
?156/312*
FP64 tensor
47,9??19,5
INT8 tensor
184,6383??624/1248*
INT4 tensor
?1248/2496*
 ↑↑↑ T(FL)OPS ↑↑↑
TMU240480?-?432
sběrnice4096bit4096bit8192bit?5120bit
kapacita
paměti
32 GB32 GB128 GB?40 GB
80 GB
HBM22,0 GHz2,4 GHz3,2 GHzHBM3?2,43 GHz
3,20 GHz
paměť.
propustn.
1024 GB/s1229 GB/s3277 GB/s?1555 GB/s
2048 GB/s
TDP300 W300 W500W~600W?400 / 250 W
transistorů13,2 mld.50,0 mld.
>100 mld.??54,2 mld.
plocha GPU331 mm²750 mm²
??826 mm²
proces7 nm7 nm7nm??7 nm
datum2018202020212022-20232020

Nově (byť stále neoficiálně) „potvrzené“ hodnoty jsou zvýrazněny tučně, výraznější změny červeně

Dále se vyjasňuje situace s podporou formátu FP32. CDNA vůbec jako první architektura vycházející z GPU nativně podporuje formát FP64 v plné rychlosti. Zdroje však byly nejednotné co do rychlosti podpory FP32. CDNA 2 podporuje packed-FP32, což znamená zpracování FP32:FP64 2:1, jinými slovy Instinct MI250X bude dosahovat až 95,7 TFLOPS v FP32. Výkon v FP64, FP32 a FP16 je tedy oproti Nvidia A100 pětinásobný, výkon ve formátu BF16 nejspíš desetinásobný.

Paradoxně ač je o akcelerátorech řady MI200 známo vše podstatné, o procesorech zatím neuniklo prakticky nic nového a buďto se tedy AMD daří držet tyto novinky pod pokličkou lépe, nebo bude důraz akce kladen na akcelerátory.

Zdroje: 

AMD (1, 2, 3)

Diskuse ke článku 8. 11. na Accelerated Data Center Premiere uvede AMD Instinct MI200 a nové Epycy

Pondělí, 8 Listopad 2021 - 19:16 | del42sa | takže ten 2xFP32 výkon je pravda :-)
Středa, 27 Říjen 2021 - 09:35 | danieel | Proc by to mela byt reakce? Prolozene cykly...
Středa, 27 Říjen 2021 - 08:09 | TyNyT | Lisa mocně přitápí pod kotlem. :-)
Středa, 27 Říjen 2021 - 07:20 | Peter Fodrek | Lebo sú drahšie a k tomu je pomerne lepšie Ian...
Středa, 27 Říjen 2021 - 07:16 | Anonym | Jak příznačné. Zatím co Intel uvede novinku pro...
Středa, 27 Říjen 2021 - 05:31 | del42sa | finanční výsledky AMD za 3Q https://www.anandtech...

Zobrazit diskusi