AMD představila 7nm Vega 20 a Radeon Instinct MI60, umí Int4 až FP64
V souladu s očekáváním AMD představila jádro Vega 20. Odhalila dva produkty na něm postavené, Radeon Instinct MI60 a Radeon Instinct MI50. Oba jsou určené pro profesionální segment, akceleraci AI.
Vega 20
GPU Vega 20 je postaveno na architektuře Vega obohacené o některé nové prvky, které dále zmíníme. Vzniká na 7nm procesu TSMC, je vůbec prvním 7nm GPU na světě a disponuje 4096 stream-procesory, 64 ROP, 4096bit HBM2 sběrnicí, rozhraním PCIe 4.0, externím rozhraním (linkami) Infinity Fabric. Dosahuje plochy 331 mm², takže je o něco menší, než se na základě odhadů z fotografií předpokládalo.
GPU | karta | rozměry | sběrnice |
---|---|---|---|
GV100 | Tesla V100 Titan V | 815 mm² | 4096 bit HBM |
TU102 | GeForce RTX 2080 Ti | 754 mm² | 384bit |
GP100 | Tesla P100 | 610 mm² | 4096 bit HBM |
GM200 | GeForce GTX Titan X GeForce GTX 980 Ti | 601 mm² | 384bit |
Fiji | Radeon Fury X | 596 mm² | 4096bit HBM |
GT200 | GeForce GTX 280 | 576 mm² | 512bit |
TU104 | GeForce RTX 2080 | 545 mm² | 256bit |
GK110 | GeForce GTX Titan GeForce GTX 780 Ti | 551/561 mm² | 384bit |
GF100 GF110 | GeForce GTX 480 GeForce GTX 580 | 529 mm² | 384bit |
G80 | GeForce 8800 GTX | 484 mm² | 384bit |
Vega 10 | Radeon RX Vega / Vega FE | 484 mm² | 2048bit HBM |
GP102 | Titan X / Xp GeForce GTX 1080 Ti | 471 mm² | 384bit |
GT200b | GeForce GTX 285 | 470 mm² | 512bit |
TU106 | GeForce RTX 2070 | 445 mm² | 256 bit |
Hawaii Grenada | Radeon R9 290X Radeon R9 390X | 438 mm² | 512bit |
R600 | Radeon HD 2900 XT | 420 mm² | 512bit |
GM204 | GeForce GTX 980 | 398 mm² | 256bit |
Cayman | Radeon HD 6970 | 389 mm² | 256bit |
Tahiti | Radeon HD 7970 Radeon R9 280X | 365 mm² | 384bit |
Tonga Antigua | Radeon R9 285 Radeon R9 380X | 359/366 mm² | 384bit |
GF114 | GeForce GTX 560 Ti | 360 mm² | 256bit |
R580 | Radeon X1900 XTX | 342 mm² | 256bit |
Cypress | Radeon HD 5870 | 336 mm² | 256bit |
G92 | GeForce 8800 GT GeForce 9800 GTX | 334 mm² | 256bit |
G70 | GeForce 7800 GTX | 334 mm² | 256bit |
Vega 20 | Radeon Instinct MI60 | 331 mm² | 4096bit HBM |
GP104 | GeForce GTX 1080 | 314 mm² | 256bit |
GK104 | GeForce GTX 680 | 294 mm² | 256bit |
R520 | Radeon X1800 XT | 288 mm² | 256bit |
NV40 | GeForce 6800 Ultra | 287 mm² | 256bit |
RV790 | Radeon HD 4890 | 282 mm² | 256bit |
R420 | Radeon X800 XT | 281 mm² | 256bit |
G92b | GeForce GTS 250 | 264 mm² | 256bit |
RV770 | Radeon HD 4870 | 256 mm² | 256bit |
Vega M | Vega Mobile | ~241 mm² | 1024bit HBM |
R430 | Radeon X800 XL | 240 mm² | 256bit |
Polaris 10 | Radeon RX 480 | 232 mm² | 256bit |
RV570 | Radeon X1950 PRO | 230 mm² | 256bit |
GM206 | GeForce GTX 960 | 227 mm² | 128bit |
G94 | GeForce 9600 GT | 225 mm² | 256bit |
R300 | Radeon 9700 PRO | 218 mm² | 256bit |
Vega KLG | Kaby Lake G | ~218 mm² | 1024bit HBM |
GK106 | GeForce GTX 660 | 214 mm² | 192bit |
NV42 | GeForce 6800 GS | 213 mm² | 256bit |
Pitcairn Curacao | Radeon HD 7870 Radeon R9 270X | 212 mm² | 256bit |
GP106 | GeForce GTX 1060 | 200 mm² | 192bit |
NV30 | GeForce FX 5800 Ultra | 200 mm² | 128bit |
G71 | GeForce 7900 GTX | 196 mm² | 256bit |
RV670 | Radeon HD 3870 | 192 mm² | 256bit |
Stream-procesory podporují formáty FP64 (1:2 - oproti Vega 10 1:16), FP32, FP16, Int8 a Int4 (nové pro Vega 20). Celočíselné formáty jsou obvykle dostačující pro ML inferencing a umožňují -násobné zvýšení výkonu oproti FP formátům s vyšší přesností.
Z externích rozhraní podporuje jádro PCIe 4.0 (oproti PCI 3.0 u Vega 10 a stejně jako nově ohlášený Epyc Rome), které umožňuje zvýšit objemy datových přenosů na dvojnásobek.
Dále Infinity Fabric Link (Vega 10 nepodporuje) s přenosovou kapacitou 100 GB/s na linku mezi jádry (patrně 50 GB/s pro přenos v jednom směru + 50 GB/s ve druhém zároveň, tedy 50 GB/s full duplex). Každé GPU je vybaveno dvěma linkami, takže lze čipy prstencově řetězit. Zdvojnásobila (× Vega 10) se také paměťová propustnost díky rozšíření paměťové sběrnice z 2048bit na 4096bit.
Radeon Instinct
Model Radeon Instinct MI60 PCIe akcelerátor vybavený plně aktivním GPU Vega 20 s 4096 stream-procesory. Taktovací frekvence jádra dosahuje 1,8 GHz a osazeno je 32 GB HBM2 s efektivním taktem 2 GHz. Datová propustnost tak dosahuje 1 TB/s. TDP limit je nastaven na 300 wattů.
- 7,4 TFLOPS FP64
- 14,7 TFLOPS FP32
- 29,4 TFLOPS FP16
- 59 TOPS INT8
- 118 TOPS INT4
Rychlost pro všechny formáty odpovídá nevyšší možné, kterou architektura umožňuje. Posledním GPU od AMD, které podporovalo FP64 v tomto poměru oproti FP32 bylo GPU Hawaii.
Radeon Instinct MI50 se liší mírně sníženým počtem stream-procesorů, kterých je aktivních 3840. Takt jádra je mírně snížen na 1,75 GHz a kapacita paměti dosahuje 16 GB. Sběrnice je však stále 4096bit, takže snížení kapacity pramení z použití HBM2 čipů o poloviční kapacitě, nikoli osazení poloviny HBM2 čipů.
Radeon Instinct MI60 bude dostupný během čtvrtého kvartálu. Oficiální doporučená cena zatím nebyla zveřejněna.
AMD, Anandtech