Radeony R9 300 vznikají na novém procesu, asynchronní shadery zvýší FPS o 25 %
Celý videorozhovor je téměř půlhodinový a i když je v něm řada zajímavostí, je jasné, že ne každý si jej z časových důvodů může přehrát celý (přesto to doporučuji :-). Rozhodl jsem se proto vybrat alespoň to nejpodstatnější - Radeony R9 300, výhody HBM, 4GB paměť Radeonu Fury X, DirectX 12 a asynchronní shadery - a pokud je třeba, vysvětlím Huddyho slova na širším kontextu:
Začněme tím prvním: Radeony R9 300 jsou podle Huddyho vyráběné jiným výrobním procesem, než jejich předchůdci, což má být jedním z důvodů pro který dostaly čipy nové názvy. Doposud bylo známo, že např. Grenada (R9 390/X) se oproti Hawaii (R9 290/X) liší paměťovým řadičem doplněným o podporu rychlých GDDR5 pamětí nebo že došlo k přepracování řízení spotřeby. Huddy zmínil dva další rozdíly: právě výrobní technologii - mělo by jít o jinou verzi 28nm výrobního procesu, která nabízí mírně lepší poměr výkon na watt. Bohužel nepadl dotaz, zda jde o jiný proces u TSMC, nebo byla výroba přesunuta ke GlobalFoundries, na jejímž 28nm procesu vzniká např. APU Kaveri / Godavari a Carrizo. Přestože je oficiálně potvrzeno, že GPU Fiji vzniká u TSMC, u nižších modelů není situace úplně jasná - některé zdroje (např. Guru 3D) tvrdí, že tyto čipy vznikají u GlobalFoundries. Druhým rozdílem by měly být neupřesněné změny, v jejichž důsledku je ve specifických situacích možné pozorovat při stejných taktech odlišný výkon. Huddy specifičtější nebyl, důvodů může být více - od aktualizace výpočetních bloků na novější revizi, přes opravu nějakého bugu až po úpravy mající vliv na latence cache apod. Jmenované změny by ale měly přinášet v průměru o 15 % vyšší energetickou efektivitu.
Zajímavější byl náhled na výhody HBM. Huddy nepřímo přiznal, že jejich použití pro GPU Fiji je trochu nadměrné z toho hlediska, že Fiji byl projektovaný jako čip pro paměťovou sběrnici s přenosovou kapacitou kolem 350 GB/s (pozn.: s HBM má 512 GB/s, např. Radeon R9 290X dosahuje 320 GB/s). Díky přemíře datové propustnosti si ale AMD mohla dovolit k paměti přistupovat jinak než u karet s GDDR5. Paměť může využívat spíše jako buffer a díky tomu permanentně přesouvat data z HBM do systémové paměti a opačně, jak je potřeba. V důsledku toho není kapacita limitujícím faktorem. V případě běžných karet s GDDR5 by to trochu problém byl, protože permanentní přesuny by z přenosové kapacity sběrnice ukrojily až 32 GB/s, což by např. u mainstreamové grafické karty s 256bit sběrnicí a ~5GHz GDDR5 zkrouhlo paměťovou propustnost o 20 % (adekvátně tomu by šel dolů i výkon).
Došlo i na DirectX 12 a jejich výhody. Huddy vzpomněl na současné procesory řad FX, které neexcelují v jednojádrovém (jednovláknovém) výkonu. Byť to už bude „s křížkem po funusu“ věří, že by DirectX 12 mohlo trochu změnit názor uživatelů na FX jakožto herní procesor. Nové API totiž umožní hrám využít všechna jádra a konečně zpřístupnit plný potenciál těchto procesorů.
Další výhodou DirectX 12 je podpora asynchronních shaderů. Znamená, že kompatibilní grafické jádro umožňuje zpracovávat více úloh najednou, aniž by muselo počkat, až bude dokončena jedna, a pak teprve začít druhou. Tuto funkcionalitu nějakou dobu nabízí například Xbox One (jehož API bylo pokročilejší než desktopové DirectX 11). Huddy zmínil, že vedl diskusi s vývojářem, který s asynchronními shadery experimentoval a výsledkem byl docela nadšený. Zjistil, že pokud během renderingu nechá s nízkou prioritou paralelně běžet visibility test (test viditelnosti, méně náročná výpočetní úloha), postará se řízení GPU, aby visibility test využíval v daný okamžik nevytížené výpočetní jednotky a výsledkem bylo, že visibility test byl dokončen dříve než rendering a to bez toho, aby se doba potřebná pro rendering prodloužila. Asynchronní shadery lze při hodně volném srovnání chápat jako určitou grafickou alternativu pro hyper-threading. Lze díky nim paralelně spustit více úloh a pokud mají odlišné požadavky na hardwarové prostředky (např. jedna na paměťové přesuny, druhá na aritmetiku), budou dokončené dříve než při tradičním sériovém zpracování.
Podle Huddyho lze v syntetických testech díky asynchronním shaderům dosáhnout až 40% zvýšení výkonu a ve hrách až 25 % navíc. Což podtrhl slovy: „Každý, kdo to umí používat, by to měl používat a kdo to používat neumí, by se to měl naučit.“ Jak z těchto slov vyplývá, je třeba, aby hra tuto technologii podporovala - pak může zpřístupnit až pár desítek procent výkonu navíc.