Rozbor: Vega 20 podporuje AI instrukce, Vega 12 má limit do 1980 MHz
Vega 20
Když unikly výsledky podtaktované (1GHz) Vegy 20 ze 3DMarku, objevil se údaj, že datová propustnost její sběrnice dosahuje 1,28 TB/s. To by byla zatím historicky vůbec nejvyšší hodnota dosažená na grafickém čipu. Její dosažení je v současnosti podmíněno kombinací 4096bit HBM2 sběrnice (což je v souladu s očekáváním Vega 20 má čtyři 1024bit paměťové kanály, tedy dvojnásobek oproti Vega 10) a 2,5GHz HBM2.
Vega 20 bude první 7nm produkt AMD. V současnosti existují vzorky, karty dostanou partneři do konce roku
To už je trochu oříšek. V současnosti jsou dostupné 2GHz HBM2 a Samsung si v lednu zasnil o 2,4GHz čipech, ale o jejich dostupnosti zatím není nic známo. Někdo tedy údaj o datové propustnosti považoval za chybnou detekci, jiní celkem oprávněně namítají, že AMD může mít v laboratořích vzorky rychlých čipů, které zatím výrobce nenabízí. Nakonec AMD může mít takové čipy více než jen v laboratoři, jak se ukázalo s Vega 10, která byla při vydání osazena čipy, jež nebyly na stránkách žádného výrobce uvedeny jako komerčně dostupné.
Zajímavostí doposud uvedenou jen v tomto starším slajdu je podpora PCIe 4.0
Otázka tedy nezní, zda vzorek GPU Vega 20 může být osazen 2,5GHz HBM2, ale proč by měl být osazen 2,5GHz HBM2. Vega 20 by měla podle dosavadních informací disponovat stejným počtem funkčních jednotek jako Vega 10, takže nároky na datovou propustnost při stejných taktech nebudou vyšší. Proč by tedy měla AMD zvyšovat datovou propustnost navyšovat 2,5×?
? | Radeon RX Vega 64 | Radeon Vega FE | |||
---|---|---|---|---|---|
GPU | Vega 20 | Vega 10 12,5 miliard tranzistorů | |||
Plocha jádra | <300 mm²? | 484 mm² | |||
Výrobní proces | 7nm TSMC? | 14nm LPP GlobalFoundries | |||
Architektura | Vega+ / GCN5+ | Vega / GCN 5 | |||
Základní takt | ? | 1247 MHz | 1406 MHz | neuv. | |
Typ. takt / boost | ? | 1546 MHz | 1677 MHz | 1382 MHz | |
Max. boost | ? | 1630 MHz 1670 MHz | 1750 MHz | 1600 MHz | |
SPs | 4096 | 4096 | 4096 | ||
TMUs | 256 | 256 | 256 | ||
ROPs | 64 | 64 | 64 | ||
FP32 | ~15 TFLOPS? | 12,7 TFLOPS | 13,7 TFLOPS | 13,1 TFLOPS | |
FP16 | ~30 TFLOPS? | 25,3 TFLOPS | 27,5 TFLOPS | 26,2 TFLOPS | |
FP64 | ~7 TFLOPS? | 0,8 TFLOPS | 0,9 TFLOPS | 0,8 TFLOPS | |
Paměti | 32 GB HBM2 | 8 GB | 16 GB HBM2 | ||
Sběrnice | 4096bit | 2048bit | 2048bit | ||
Frekvence | ≤2500 MHz | 1888 MHz | 1887 MHz | ||
Dat. propustnost | ≤1280 GB/s | 483 GB/s | 483 GB/s | ||
TGP | ? | 220 W | 264 W | ? | ? |
TDP / TBP | 150-300W | 295 W | 345 W | 300 W | 375 W |
Napájení | ? | 8+8 pin | 8+8 pin | ||
Výstupy | ? | HDMI 2.0b | HDMI 2.0b | HDMI 2.0b | |
TrueAudio | ? | Next | Next | Next | |
XDMA CF | ? | ||||
FreeSync | ? | ||||
Rozhraní | PCIe ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 | |
API | DirectX 12 | DirectX 12 | DirectX 12 | DirectX 12 | |
Vydání | 2019 | 30. 7. 2017 14. 8. 2017 | 30. 7. 2017 14. 8. 2017 | 16. 5. 2017 27. 6. 2017 | |
Chlazení | ? | vzduch. | vodní | vzduch. | vodní |
Cena | ? | $499 $599 pack | $699 pack | $999 | $1499 |
Původně se předpokládalo, že důvodem ke zdvojnásobení počtu paměťových kanálů není ani tak potřeba vyšší datové propustnosti, ale vyšší kapacity pamětí v profesionálním segmentu. Dvakrát širší sběrnice znamená možnost osazení dvojnásobku pamětí, tedy až 32 GB pro Vega 20 namísto až 16 GB pro Vega 10. Zdvojnásobení propustnosti se tak jevilo spíš jako vedlejší efekt, který by teoreticky ani nemusel být využit, protože pokud jde primárně o kapacitu a ne o propustnost, mohla by AMD namísto 2GHz HBM2 použít levnější 1,6GHz HBM2 a stále by díky širší sběrnici byla datová propustnost Vega 20 asi o 2/3 vyšší než u Vega 10.
Vega 20 (GFX906)
fdot2, sdot2, udot2.
sdot4, udot4.
sdot8, udot8.
Nově dostupné údaje ale naznačují, že AMD přinejmenším experimentuje s mnohem vyššími hodnotami, které jsou ~2,5× vyšší oproti Vega 10, ~1,8× vyšší oproti Nvidia Pascal P100 a ~1,4× vyšší oproti Nvidia Volta V100. Takový posun, pokud je reálný, musí mít racionální důvod. Na jeho existenci poukazují čerstvě uniklé informace, podle kterých bude Vega 20 podporovat operace s maticemi více úrovní. Při jejich využití ale může dojít ke zvýšení požadavku na datové přenosy (pokud za jednotku času zvládáte zpracovat více dat, musíte být schopní také za jednotku času více dat přenést, jinak se zvýšení výkonu nedostaví).
Podporu Deep Learning Operations bez bližšího upřesnění avizovala AMD pro Vega 20 již na CES
Právě to by mohlo být důvodem, proč AMD sáhla po nejrychlejších dostupných pamětech. V současnosti se také objevují údaje až o pohádkově vysokém výkonu v tensorových operacích, ale to zatím berme jen jako povídačky. I pokud by se údaje měly zakládat na pravdě, budou se patrně týkat jen specifických scénářů.
Vega 12
O Vega 12 toho není příliš známého. Pokud si zrekapitulujeme situaci, máme tu GPU Vega 10 známé mj. z Radeonů RX Vega 56/64 a Frontier Edition, víme leccos o Vega 20, 7nm verzi upravené pro výpočetní nasazení a očekává se Vega 11, primárně mobilní GPU. O Vega 12 víme s jistotou jen to, že existuje.
Vega 11 známá také jako Vega Mobile se očekává koncem jara nebo v létě
Dalo by se předpokládat, že jde o pomalejší produkt než je Vega 11 (která však má být o něco rychlejší než GPU na Kaby Lake-G) a dále se objevily názory, že by mohlo jít o produkt určený exkluzivně pro Apple. Osobně bych to na úplnou exkluzivitu neviděl - v takovém případě by totiž šlo o semi-custom produkt a ty nedostávají standardní značení jako „Vega XY“. To ovšem nevylučuje, že by se toto jádro mohlo v nabídce Applu objevit ani případnou dočasnou exkluzivitu - jako třeba u plně aktivní verze Polaris 11.
#define VEGA12_ENGINECLOCK_HARDMAX 198000
static int init_powerplay_table_information(
struct pp_hwmgr *hwmgr,
const ATOM_Vega12_POWERPLAYTABLE *powerplay_table)
Prvním zdrojem informací, který o Vega 12 říká něco konkrétního, je kód na githubu. Kupříkladu řádka „#define VEGA12_ENGINECLOCK_HARDMAX 198000“ ukazuje na limit pro nastavení maximálního možného taktu jádra na 1980 MHz. Nikdo samozřejmě netvrdí, že nebo zda na něj jádro bude možné stabilně přetaktovat.
Na další zajímavosti v kódu upozornil uživatel ethernity, podle něhož stojí za pozornost nový SMU mikrokód a zvýšení počtu úrovní DPM (digital power management, stupně řízení spotřeby) na 16 z původních 8 u Vega 10. Dále zjednodušenou správu chlazení a chybějící ovládání LED (které bylo u Vega 10). Řízení otáček chladiče zůstalo, což by mohlo indikovat použití i v desktopu. Zmizela ale velká část složitého kódu týkající se řízení chladiče a LED.
Tyto údaje ukazují, že čip bude primárně spíš mobilní záležitostí, respektive že cílí na systémy citlivé na spotřebu, rozměry a množství odpadního tepla. Celkově se zdá, že jde o prvotní podporu v tomto ovladači (zmínka v o Vega 12 v ovladači pro Windows se objevila již v lednu), takže do finální verze potřebné k vydání produktu se zdá být ještě daleko.