Specifikace architektury Vega odhaleny
AMD před pár dny spustila web VE.GA, na kterém upozornila na čtvrteční preview / odhalení nové architektury. Všeteční uživatelé brzy postřehli, že web nemá vypnuté procházení adresářů a po jejich prozkoumání narazili na výše znázorněný grafický sumář prvků Vegy. Nyní už je procházení adresářů blokované, ale grafika zůstala. Je zřejmé, že měla být na webu zveřejněna až ve čtvrtek po 15. hodině, takže jsme se k ní dostali o několik dní s předstihem. Výčet obsahuje následujících 14 položek:
- 2× Peak Throughput per Clock
- 4× Power Efficiency
- 8× Capacity / Stack
- High Bandwidth Cache
- Draw Stream Binning Rasterizer
- Primitive Shaders
- High Bandwidth Cache Controller
- Next Generation Computer Engine
- 2× Bandwidth per Pin
- 512 TB
- Virtual Address Space
- Vega NCU
- Next Generation Pixel Engine
- Rapid Packed Math
Mohli bychom se domnívat, že se grafik dopustil pár chybek (např. „512 TB“ namísto „512 TB/s“ nebo možného písmenka navíc v „Next Generation Computer Engine“), ale to nic nemění na autenticitě materiálu. Podívejme se na některé položky podrobněji.
2× Peak Throughput per Clock - dvojnásobná propustnost v taktu. Tento údaj reflektuje podporu formátu FP16 při 2× vyšším výkonu než FP32. Jinak řečeno, při použití formátu FP16 nabídne Vega 2× rychlejší zpracování dat než Fiji. Totéž, jen jinými slovy, je míněno i položkou Rapid Packed Math. Z herního hlediska jde prozatím o vedlejší záležitost, hry FP16 nevyužívají a v nejbližší době asi ani nebudou. Přínos se týká výpočetní sféry, umělé inteligence.
4× Power Efficiency - čtyřnásobná energetická efektivita. Tento údaj se opět zcela jistě týká výpočtů s přesností FP16, tedy opět profi segmentu. Těžko říct, s jakým modelem je srovnáváno - patrně s tím, vůči kterému je nárůst nejvyšší. To by mohl být Radeon Fury (bez X), který dosahuje FP16 výkonu 7,2 TFLOPS při TDP 275 wattů. Pokud by GPU Vega 10 mělo dosáhnout čtyřnásobné efektivity, muselo by (řekněme) při TDP 250 wattů dosáhnout FP16 výkonu 26,2 TFLOPS. To znamená FP32 výkonu 13,1 TFLOPS, což by při očekávaných 4096 stream-procesorech znamenalo takt téměř 1600 MHz. Některé starší zprávy naznačovaly takty kolem 1500 MHz, ale ±1600 MHz už by bylo dost velké překvapení. Je proto možné, že buďto Vega 10 poběží na nižších taktech a bude mít i nižší TDP, nebo že se údaj o energetické efektivitě týká nějakého níže taktovaného modelu, jakési obdobě Nano. Například ~1300 MHz při TDP ~200 wattů nebo ~1100 MHz při TDP ~175 wattů.
8× Capacity / Stack - osminásobná kapacita na svazek se patrně vztahuje k HBM pamětem. V případě Fiji dosahoval každý HBM čip 1GB kapacity, s novou generací pamětí to může být až 8 GB, což při dvou svazcích (odpovídajících uvedené propustnosti 2× Bandwidth per Pin, tedy 512 GB/s) znamená možnost dosažení až 16 GB paměti. To se patrně bude týkat profesionálních modelů; desktopové si vystačí s polovinou.
Draw Stream Binning Rasterizer - zmínka o novém rasterizéru je patrně nejpodstatnější informací ze seznamu. Rasterizér se po léta vyvíjel pouze evolučně a zatímco mnohé části čipu podstoupily během jednotlivých generací architektury GCN celkovou proměnu, rasterizér a struktura cache na hlubší přepracování čekala. Existují názory, že právě rasterizér patřil k prvkům, které nejvýznamněji limitovaly grafický výkon čipů. Zda na tom bude něco pravdy, uvidíme po vydání. Nějaké úpravy se zřejmě dočká i zmíněná cache - alespoň to naznačují položky High Bandwidth Cache a High Bandwidth Cache Controller.
Některé z termínů sice naznačují, čeho by se mohly týkat, ale na jejich přesný význam si budeme muset počkat. Více se dozvíme snad ve čtvrtek odpoledne, kdy dojde k odhalení architektury.