Diit.cz - Novinky a informace o hardware, software a internetu

Rozbor: Vega 20 podporuje AI instrukce, Vega 12 má limit do 1980 MHz

O GPU Vega 12 toho zatím moc řečeno nebylo a příliš se toho neví ani o větším Vega 20. K oběma něco prozradily (nejen) uniklé patche…
Amd Vega 10 Wafer 02

Vega 20

Když unikly výsledky podtaktované (1GHz) Vegy 20 ze 3DMarku, objevil se údaj, že datová propustnost její sběrnice dosahuje 1,28 TB/s. To by byla zatím historicky vůbec nejvyšší hodnota dosažená na grafickém čipu. Její dosažení je v současnosti podmíněno kombinací 4096bit HBM2 sběrnice (což je v souladu s očekáváním Vega 20 má čtyři 1024bit paměťové kanály, tedy dvojnásobek oproti Vega 10) a 2,5GHz HBM2.

Vega 20 bude první 7nm produkt AMD. V současnosti existují vzorky, karty dostanou partneři do konce roku

To už je trochu oříšek. V současnosti jsou dostupné 2GHz HBM2 a Samsung si v lednu zasnil o 2,4GHz čipech, ale o jejich dostupnosti zatím není nic známo. Někdo tedy údaj o datové propustnosti považoval za chybnou detekci, jiní celkem oprávněně namítají, že AMD může mít v laboratořích vzorky rychlých čipů, které zatím výrobce nenabízí. Nakonec AMD může mít takové čipy více než jen v laboratoři, jak se ukázalo s Vega 10, která byla při vydání osazena čipy, jež nebyly na stránkách žádného výrobce uvedeny jako komerčně dostupné.

Amd Vega 20 Specifications

Zajímavostí doposud uvedenou jen v tomto starším slajdu je podpora PCIe 4.0

Otázka tedy nezní, zda vzorek GPU Vega 20 může být osazen 2,5GHz HBM2, ale proč by měl být osazen 2,5GHz HBM2. Vega 20 by měla podle dosavadních informací disponovat stejným počtem funkčních jednotek jako Vega 10, takže nároky na datovou propustnost při stejných taktech nebudou vyšší. Proč by tedy měla AMD zvyšovat datovou propustnost navyšovat 2,5×?

 ?Radeon RX
Vega 64
Radeon
Vega FE
GPUVega 20Vega 10
12,5 miliard tranzistorů
Plocha jádra<300 mm²?484 mm²
Výrobní proces7nm TSMC?14nm LPP GlobalFoundries
ArchitekturaVega+ / GCN5+Vega / GCN 5
Základní takt?1247 MHz1406 MHzneuv.
Typ. takt / boost?1546 MHz1677 MHz1382 MHz
Max. boost?1630 MHz
1670 MHz
1750 MHz1600 MHz
SPs409640964096
TMUs256256256
ROPs646464
FP32~15 TFLOPS?12,7 TFLOPS13,7 TFLOPS13,1 TFLOPS
FP16~30 TFLOPS?25,3 TFLOPS27,5 TFLOPS26,2 TFLOPS
FP64~7 TFLOPS?0,8 TFLOPS0,9 TFLOPS0,8 TFLOPS
Paměti32 GB
HBM2

8 GB
HBM2

16 GB
HBM2
Sběrnice4096bit

2048bit

2048bit
Frekvence≤2500 MHz1888 MHz1887 MHz
Dat. propustnost≤1280 GB/s483 GB/s483 GB/s
TGP?220 W264 W??
TDP / TBP150-300W295 W345 W300 W375 W
Napájení?8+8 pin8+8 pin
Výstupy?

HDMI 2.0b
3× DP 1.4 

HDMI 2.0b
3× DP 1.4

HDMI 2.0b
3× DP 1.4

TrueAudio?Next Next Next
XDMA CF?
FreeSync?
RozhraníPCIe ×16PCIe 3.0 ×16 PCIe 3.0 ×16 PCIe 3.0 ×16
API

DirectX 12
Vulkan

DirectX 12
Vulkan

DirectX 12
Vulkan 

DirectX 12
Vulkan

Vydání201930. 7. 2017
14. 8. 2017
30. 7. 2017
14. 8. 2017

16. 5. 2017

27. 6. 2017

Chlazení?vzduch.vodní

vzduch.

vodní
Cena?$499
$599 pack
$699 pack$999$1499

Původně se předpokládalo, že důvodem ke zdvojnásobení počtu paměťových kanálů není ani tak potřeba vyšší datové propustnosti, ale vyšší kapacity pamětí v profesionálním segmentu. Dvakrát širší sběrnice znamená možnost osazení dvojnásobku pamětí, tedy až 32 GB pro Vega 20 namísto až 16 GB pro Vega 10. Zdvojnásobení propustnosti se tak jevilo spíš jako vedlejší efekt, který by teoreticky ani nemusel být využit, protože pokud jde primárně o kapacitu a ne o propustnost, mohla by AMD namísto 2GHz HBM2 použít levnější 1,6GHz HBM2 a stále by díky širší sběrnici byla datová propustnost Vega 20 asi o 2/3 vyšší než u Vega 10.

Vega 20 (GFX906)
fdot2, sdot2, udot2.
sdot4, udot4.
sdot8, udot8.

Nově dostupné údaje ale naznačují, že AMD přinejmenším experimentuje s mnohem vyššími hodnotami, které jsou ~2,5× vyšší oproti Vega 10, ~1,8× vyšší oproti Nvidia Pascal P100 a ~1,4× vyšší oproti Nvidia Volta V100. Takový posun, pokud je reálný, musí mít racionální důvod. Na jeho existenci poukazují čerstvě uniklé informace, podle kterých bude Vega 20 podporovat operace s maticemi více úrovní. Při jejich využití ale může dojít ke zvýšení požadavku na datové přenosy (pokud za jednotku času zvládáte zpracovat více dat, musíte být schopní také za jednotku času více dat přenést, jinak se zvýšení výkonu nedostaví).

Podporu Deep Learning Operations bez bližšího upřesnění avizovala AMD pro Vega 20 již na CES

Právě to by mohlo být důvodem, proč AMD sáhla po nejrychlejších dostupných pamětech. V současnosti se také objevují údaje až o pohádkově vysokém výkonu v tensorových operacích, ale to zatím berme jen jako povídačky. I pokud by se údaje měly zakládat na pravdě, budou se patrně týkat jen specifických scénářů.

Vega 12

O Vega 12 toho není příliš známého. Pokud si zrekapitulujeme situaci, máme tu GPU Vega 10 známé mj. z Radeonů RX Vega 56/64 a Frontier Edition, víme leccos o Vega 20, 7nm verzi upravené pro výpočetní nasazení a očekává se Vega 11, primárně mobilní GPU. O Vega 12 víme s jistotou jen to, že existuje.

Vega 11 známá také jako Vega Mobile se očekává koncem jara nebo v létě

Dalo by se předpokládat, že jde o pomalejší produkt než je Vega 11 (která však má být o něco rychlejší než GPU na Kaby Lake-G) a dále se objevily názory, že by mohlo jít o produkt určený exkluzivně pro Apple. Osobně bych to na úplnou exkluzivitu neviděl - v takovém případě by totiž šlo o semi-custom produkt a ty nedostávají standardní značení jako „Vega XY“. To ovšem nevylučuje, že by se toto jádro mohlo v nabídce Applu objevit ani případnou dočasnou exkluzivitu - jako třeba u plně aktivní verze Polaris 11.

#define VEGA12_ENGINECLOCK_HARDMAX 198000
static int init_powerplay_table_information(
struct pp_hwmgr *hwmgr,
const ATOM_Vega12_POWERPLAYTABLE *powerplay_table)

Prvním zdrojem informací, který o Vega 12 říká něco konkrétního, je kód na githubu. Kupříkladu řádka „#define VEGA12_ENGINECLOCK_HARDMAX 198000“ ukazuje na limit pro nastavení maximálního možného taktu jádra na 1980 MHz. Nikdo samozřejmě netvrdí, že nebo zda na něj jádro bude možné stabilně přetaktovat.

Na další zajímavosti v kódu upozornil uživatel ethernity, podle něhož stojí za pozornost nový SMU mikrokód a zvýšení počtu úrovní DPM (digital power management, stupně řízení spotřeby) na 16 z původních 8 u Vega 10. Dále zjednodušenou správu chlazení a chybějící ovládání LED (které bylo u Vega 10). Řízení otáček chladiče zůstalo, což by mohlo indikovat použití i v desktopu. Zmizela ale velká část složitého kódu týkající se řízení chladiče a LED.

Tyto údaje ukazují, že čip bude primárně spíš mobilní záležitostí, respektive že cílí na systémy citlivé na spotřebu, rozměry a množství odpadního tepla. Celkově se zdá, že jde o prvotní podporu v tomto ovladači (zmínka v o Vega 12 v ovladači pro Windows se objevila již v lednu), takže do finální verze potřebné k vydání produktu se zdá být ještě daleko.

Zdroje: 

Diskuse ke článku Rozbor: Vega 20 podporuje AI instrukce, Vega 12 má limit do 1980 MHz

Středa, 9 Květen 2018 - 14:13 | mittar | Specificke instrukce pro umelou inteligenci
Úterý, 8 Květen 2018 - 22:29 | Tralalák | Čo sú AI instrukce? :-)
Úterý, 8 Květen 2018 - 19:29 | danieel | To s tim PCIe Gen4 je zajimave, ale pokud mi je...
Úterý, 8 Květen 2018 - 15:30 | Zog Zogothowics | Redmarx a Jarda.... kdyby blbost generovala...
Úterý, 8 Květen 2018 - 09:41 | Peter Fodrek | >Vždyť se tu nedávno psalo, že ji chtějí...
Úterý, 8 Květen 2018 - 08:55 | Jaroslav Crha | Bespi: Můžeš mi říct kde se to papouškuje? Vůbec...
Úterý, 8 Květen 2018 - 07:18 | Redmarx | Ja to chapu, kdyz tak me oprav: AMD planuje: Vega...
Úterý, 8 Květen 2018 - 02:02 | Bespi | Nechapes informace vubec. O Vega 20 se vi skoro...
Úterý, 8 Květen 2018 - 01:45 | Redmarx | Chapu informace v clanku spravne tak, ze AMD v...

Zobrazit diskusi