Rozbor: Vega 20 podporuje AI instrukce, Vega 12 má limit do 1980 MHz

8. 5. 2018 | no-X | Hardware, Novinky, Grafiky

O GPU Vega 12 toho zatím moc řečeno nebylo a příliš se toho neví ani o větším Vega 20. K oběma něco prozradily (nejen) uniklé patche…

Vega 20

Když unikly výsledky podtaktované (1GHz) Vegy 20 ze 3DMarku, objevil se údaj, že datová propustnost její sběrnice dosahuje 1,28 TB/s. To by byla zatím historicky vůbec nejvyšší hodnota dosažená na grafickém čipu. Její dosažení je v současnosti podmíněno kombinací 4096bit HBM2 sběrnice (což je v souladu s očekáváním Vega 20 má čtyři 1024bit paměťové kanály, tedy dvojnásobek oproti Vega 10) a 2,5GHz HBM2.

Vega 20 bude první 7nm produkt AMD. V současnosti existují vzorky, karty dostanou partneři do konce roku

To už je trochu oříšek. V současnosti jsou dostupné 2GHz HBM2 a Samsung si v lednu zasnil o 2,4GHz čipech, ale o jejich dostupnosti zatím není nic známo. Někdo tedy údaj o datové propustnosti považoval za chybnou detekci, jiní celkem oprávněně namítají, že AMD může mít v laboratořích vzorky rychlých čipů, které zatím výrobce nenabízí. Nakonec AMD může mít takové čipy více než jen v laboratoři, jak se ukázalo s Vega 10, která byla při vydání osazena čipy, jež nebyly na stránkách žádného výrobce uvedeny jako komerčně dostupné.

Zajímavostí doposud uvedenou jen v tomto starším slajdu je podpora PCIe 4.0

Otázka tedy nezní, zda vzorek GPU Vega 20 může být osazen 2,5GHz HBM2, ale proč by měl být osazen 2,5GHz HBM2. Vega 20 by měla podle dosavadních informací disponovat stejným počtem funkčních jednotek jako Vega 10, takže nároky na datovou propustnost při stejných taktech nebudou vyšší. Proč by tedy měla AMD zvyšovat datovou propustnost navyšovat 2,5×?

	?	Radeon RX Vega 64		Radeon Vega FE
GPU	Vega 20	Vega 10 12,5 miliard tranzistorů
Plocha jádra	<300 mm²?	484 mm²
Výrobní proces	7nm TSMC?	14nm LPP GlobalFoundries
Architektura	Vega+ / GCN5+	Vega / GCN 5
Základní takt	?	1247 MHz	1406 MHz	neuv.
Typ. takt / boost	?	1546 MHz	1677 MHz	1382 MHz
Max. boost	?	1630 MHz 1670 MHz	1750 MHz	1600 MHz
SPs	4096	4096		4096
TMUs	256	256		256
ROPs	64	64		64
FP32	~15 TFLOPS?	12,7 TFLOPS	13,7 TFLOPS	13,1 TFLOPS
FP16	~30 TFLOPS?	25,3 TFLOPS	27,5 TFLOPS	26,2 TFLOPS
FP64	~7 TFLOPS?	0,8 TFLOPS	0,9 TFLOPS	0,8 TFLOPS
Paměti	32 GB HBM2	8 GB HBM2		16 GB HBM2
Sběrnice	4096bit	2048bit		2048bit
Frekvence	≤2500 MHz	1888 MHz		1887 MHz
Dat. propustnost	≤1280 GB/s	483 GB/s		483 GB/s
TGP	?	220 W	264 W	?	?
TDP / TBP	150-300W	295 W	345 W	300 W	375 W
Napájení	?	8+8 pin		8+8 pin
Výstupy	?	HDMI 2.0b 3× DP 1.4	HDMI 2.0b 3× DP 1.4	HDMI 2.0b 3× DP 1.4
TrueAudio	?	Next	Next	Next
XDMA CF	?
FreeSync	?
Rozhraní	PCIe ×16	PCIe 3.0 ×16	PCIe 3.0 ×16	PCIe 3.0 ×16
API	DirectX 12 Vulkan	DirectX 12 Vulkan	DirectX 12 Vulkan	DirectX 12 Vulkan
Vydání	2019	30. 7. 2017 14. 8. 2017	30. 7. 2017 14. 8. 2017	16. 5. 2017 27. 6. 2017
Chlazení	?	vzduch.	vodní	vzduch.	vodní
Cena	?	$499 $599 pack	$699 pack	$999	$1499

Původně se předpokládalo, že důvodem ke zdvojnásobení počtu paměťových kanálů není ani tak potřeba vyšší datové propustnosti, ale vyšší kapacity pamětí v profesionálním segmentu. Dvakrát širší sběrnice znamená možnost osazení dvojnásobku pamětí, tedy až 32 GB pro Vega 20 namísto až 16 GB pro Vega 10. Zdvojnásobení propustnosti se tak jevilo spíš jako vedlejší efekt, který by teoreticky ani nemusel být využit, protože pokud jde primárně o kapacitu a ne o propustnost, mohla by AMD namísto 2GHz HBM2 použít levnější 1,6GHz HBM2 a stále by díky širší sběrnici byla datová propustnost Vega 20 asi o 2/3 vyšší než u Vega 10.

Vega 20 (GFX906)
fdot2, sdot2, udot2.
sdot4, udot4.
sdot8, udot8.

Nově dostupné údaje ale naznačují, že AMD přinejmenším experimentuje s mnohem vyššími hodnotami, které jsou ~2,5× vyšší oproti Vega 10, ~1,8× vyšší oproti Nvidia Pascal P100 a ~1,4× vyšší oproti Nvidia Volta V100. Takový posun, pokud je reálný, musí mít racionální důvod. Na jeho existenci poukazují čerstvě uniklé informace, podle kterých bude Vega 20 podporovat operace s maticemi více úrovní. Při jejich využití ale může dojít ke zvýšení požadavku na datové přenosy (pokud za jednotku času zvládáte zpracovat více dat, musíte být schopní také za jednotku času více dat přenést, jinak se zvýšení výkonu nedostaví).

Podporu Deep Learning Operations bez bližšího upřesnění avizovala AMD pro Vega 20 již na CES

Právě to by mohlo být důvodem, proč AMD sáhla po nejrychlejších dostupných pamětech. V současnosti se také objevují údaje až o pohádkově vysokém výkonu v tensorových operacích, ale to zatím berme jen jako povídačky. I pokud by se údaje měly zakládat na pravdě, budou se patrně týkat jen specifických scénářů.

Vega 12

O Vega 12 toho není příliš známého. Pokud si zrekapitulujeme situaci, máme tu GPU Vega 10 známé mj. z Radeonů RX Vega 56/64 a Frontier Edition, víme leccos o Vega 20, 7nm verzi upravené pro výpočetní nasazení a očekává se Vega 11, primárně mobilní GPU. O Vega 12 víme s jistotou jen to, že existuje.

Vega 11 známá také jako Vega Mobile se očekává koncem jara nebo v létě

Dalo by se předpokládat, že jde o pomalejší produkt než je Vega 11 (která však má být o něco rychlejší než GPU na Kaby Lake-G) a dále se objevily názory, že by mohlo jít o produkt určený exkluzivně pro Apple. Osobně bych to na úplnou exkluzivitu neviděl - v takovém případě by totiž šlo o semi-custom produkt a ty nedostávají standardní značení jako „Vega XY“. To ovšem nevylučuje, že by se toto jádro mohlo v nabídce Applu objevit ani případnou dočasnou exkluzivitu - jako třeba u plně aktivní verze Polaris 11.

#define VEGA12_ENGINECLOCK_HARDMAX 198000
static int init_powerplay_table_information(
 struct pp_hwmgr *hwmgr,
 const ATOM_Vega12_POWERPLAYTABLE *powerplay_table)

Prvním zdrojem informací, který o Vega 12 říká něco konkrétního, je kód na githubu. Kupříkladu řádka „#define VEGA12_ENGINECLOCK_HARDMAX 198000“ ukazuje na limit pro nastavení maximálního možného taktu jádra na 1980 MHz. Nikdo samozřejmě netvrdí, že nebo zda na něj jádro bude možné stabilně přetaktovat.

Na další zajímavosti v kódu upozornil uživatel ethernity, podle něhož stojí za pozornost nový SMU mikrokód a zvýšení počtu úrovní DPM (digital power management, stupně řízení spotřeby) na 16 z původních 8 u Vega 10. Dále zjednodušenou správu chlazení a chybějící ovládání LED (které bylo u Vega 10). Řízení otáček chladiče zůstalo, což by mohlo indikovat použití i v desktopu. Zmizela ale velká část složitého kódu týkající se řízení chladiče a LED.

Tyto údaje ukazují, že čip bude primárně spíš mobilní záležitostí, respektive že cílí na systémy citlivé na spotřebu, rozměry a množství odpadního tepla. Celkově se zdá, že jde o prvotní podporu v tomto ovladači (zmínka v o Vega 12 v ovladači pro Windows se objevila již v lednu), takže do finální verze potřebné k vydání produktu se zdá být ještě daleko.

Tagy:

Vega 12, Vega 20, umělá inteligence, HBM2, AMD

Zdroje:

WCCFTech, Github, B3Df

nahlásit chybu

Jiří "no-X" Souček

více článků, blogů a informací o autorovi

Diskuse ke článku Rozbor: Vega 20 podporuje AI instrukce, Vega 12 má limit do 1980 MHz

Středa, 9 Květen 2018 - 14:13 | mittar | Specificke instrukce pro umelou inteligenci

Úterý, 8 Květen 2018 - 22:29 | Tralalák | Čo sú AI instrukce? :-)

Úterý, 8 Květen 2018 - 19:29 | danieel | To s tim PCIe Gen4 je zajimave, ale pokud mi je...

Úterý, 8 Květen 2018 - 15:30 | Zog Zogothowics | Redmarx a Jarda.... kdyby blbost generovala...

Úterý, 8 Květen 2018 - 09:41 | Peter Fodrek | >Vždyť se tu nedávno psalo, že ji chtějí...

Úterý, 8 Květen 2018 - 08:55 | Jaroslav Crha | Bespi: Můžeš mi říct kde se to papouškuje? Vůbec...

Úterý, 8 Květen 2018 - 07:18 | RedMaX | Ja to chapu, kdyz tak me oprav: AMD planuje: Vega...

Úterý, 8 Květen 2018 - 02:02 | Bespi | Nechapes informace vubec. O Vega 20 se vi skoro...

Úterý, 8 Květen 2018 - 01:45 | RedMaX | Chapu informace v clanku spravne tak, ze AMD v...

Zobrazit diskusi

Diit.cz - Novinky a informace o hardware, software a internetu

Rozbor: Vega 20 podporuje AI instrukce, Vega 12 má limit do 1980 MHz

Vega 20

Vega 12

Jiří "no-X" Souček

Diskuse ke článku Rozbor: Vega 20 podporuje AI instrukce, Vega 12 má limit do 1980 MHz

Komerční sdělení

CDR Hry

Epic rozdává zdarma dvě hry

Levnější vánoční dárky? Kde hledat kupony a jak se vyhnout falešným slevám

Vědci představili plast, který se po použití sám rozpadne a nezatíží přírodu

Čtrnáct let tichého hackingu. Obří síť falešných hazardních webů je jen zástěrka

Google vylepšuje Android: Circle to Search odhalí podvodný obsah na displeji

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT