AMD s Navi 31 cílila na trojnásobek Navi 21; dosáhne ~75 TFLOPS
Podle exkluzivních informací redakce webu RedGamingTech, se s architekturou RDNA 3 v začátcích jejího vývoje rozhodla AMD dosáhnout trojnásobku toho, kam se dostala s RDNA 2 (Navi 21). Navi 21 (Radeon RX 6900 XT) přitom cílila na dvojnásobek výkonu Navi 10 (Radeon RX 5700 XT). Dvojnásobek nebo trojnásobek se může z laického pohledu jevit jako malý rozdíl, opak je však pravdou. S Navi 21 šlo o dvojnásobek a především nešlo o dvojnásobek výkonu high-endu předchozí generace, ale dvojnásobek výkonu produktu na pozici mezi mainstreamem a high-endem, tedy segmentem občas označovaným jako midrange. Byl tu navíc velký prostor pro optimalizace taktovacích frekvencí (Navi 10 nebyla v tomto ohledu výrazně nad poslední generací Vegy) a byl tu velký potenciál v podobě nasazení Infinity Cache.
Navi 21 se zvýrazněnou Infinity Cache
Tím se AMD podařilo dosáhnout z tehdejšího pohledu velmi výrazného posunu, který překvapil i Nvidii, která na poslední chvíli upravovala specifikace karet - napřílad GeForce RTX 3080 namísto druhého nejvýkonnějšího herního GPU postavila na top modelu.
Navi 31 s architekturou RDNA 3 je v tomto ohledu ještě ambicióznější, neboť si AMD za cíl této generace nastavila trojnásobek Navi 21. Frekvenční optimalizace jsou z velké části vyčerpané, hlavní výhoda Infinity Cache již byla využitá a tentokrát jde navíc o trojnásobek oproti top modelu, nikoli midrange segmentu. Prostor tedy budou nejspíš vytvářet hlavně čiplety a 5nm proces. Infinity Cache už bude mít jen evoluční vliv, byť výrazný.
Informace o 2,5-násobku a později 2,7-násobku výkonu Navi 31 oproti Navi 21 pak měla odpovídat reálně srovnávanému výkonu, jak se AMD postupně dařilo řešit bugy, využívat rezervy a ladit návrh. V současnosti má být dosaženo koeficientu až 2,8×, což je hodnota velmi blízká teoretickému trojnásobku.
Navi 31 by podle téhož zdroje měla dosahovat aritmetického výkonu kolem 75 TFLOPS; tuto hodnotu si můžete porovnat se stávajícími modely:
- Radeon RX 6700 XT: 13,2 TFLOPS
- Radeon RX 6800: 16,2 TFLOPS
- Radeon RX 6800 XT: 20,7 TFLOPS
- Radeon RX 6900 XT: 23,0 TFLOPS
- (Radeon RX 6900 XT LC OEM: 24,9 TFLOPS)
Pro dosažení FPS blízkých trojnásobku ovšem nestačí mít jen trojnásobný aritmetický výkon. Je zapotřebí ztrojnásobit i výkon texturovací (což půjde nejspíš ruku v ruce s výkonem aritmetickým) a dále tomuto cíli musí být uzpůsoben i výkon rasterizační a paměťová propustnost. Navi 21 disponuje 128 ROP jednotkami, což byl dvojnásobek oproti Navi 10 (64). Osobně se domnívám, že 64 ROP Navi 10 i 128 ROP Navi 21 bylo malinko více, než karty s tímto výkonem dokázaly plně využít a že by tedy AMD v případě Navi 31 nemusela osadit trojnásobek ROP (tj. 384), ale že by mohl stačit dvojnásobek, 256. To ale není více než jen osobní odhad.
18GHz GDDR6 se v současnosti používají u nejdražších OC modelů Radeonu RX 6900 XT
Možná zajímavější úvaha se váže k paměťové propustnosti. Je známo, že Navi 31 zůstane u 256bit sběrnice a dále že zůstane i u GDDR6 pamětí. Tím pádem je maximální teoretický možný posun paměťové propustnosti dán přechodem ze 16GHz na 18GHz moduly. To je 12,5% posun. Jenže pro zajištění cíleného výkonu samozřejmě nemůže stačit posun propustnosti na úrovni desítek procent, je zapotřebí posun řádově v násobcích. Což musí zajistit Infinity Cache.
Níže uvedená tabulka rekapituluje hodnoty získané a odvozené z materiálů, které AMD uvolnila při vydání architektury RDNA 2. Vyjadřuje především efektivní propustnost Infinity Cache při různých kombinacích její kapacity a cílového rozlišení:
fyzická propustn. IC | plocha IC*** | hit-rate a efektivní propustnost IC (GB/s) | ||||||
---|---|---|---|---|---|---|---|---|
1920×1080 | 2560×1440 | 3840×2160 | ||||||
8 MB | 124 GB/s | 8 mm² | 25 % | 31 | 17 % | 21 | 14 % | 17 |
12 MB | 186 GB/s | 12 mm² | 31 % | 58 | 19 % | 35 | 15 % | 28 |
16 MB | 248 GB/s | 16 mm² | 37 % | 92 | 25 % | 62 | 17 % | 42 |
24 MB | 373 GB/s | 24 mm² | 48 % | 179 | 31 % | 116 | 24 % | 90 |
32 MB | 497 GB/s | 32 mm² | 55 % | 273 | 39 % | 194 | 26 % | 129 |
48 MB | 745 GB/s | 48 mm² | 66 % | 492 | 49 % | 365 | 34 % | 253 |
64 MB | 993 GB/s | 64 mm² | 72 % | 715 | 59 % | 586 | 41 % | 407 |
96 MB | 1490 GB/s | 96 mm² | 78 % | 1162 | 66 % | 983 | 52 % | 775 |
128MB | 1987 GB/s | 128 mm² | 81 % | 1609 | 74 % | 1470 | 62 % | 1232 |
Zapomeňme na všechny řádky tabulky, kromě posledního, pro 128MB kapacitu, která se týká současného top-modelu, Navi 21. Zůstaňme pouze u 4k rozlišení (3840×2160) - pokud jde o high-end příští generace, nikdo si ho nejspíš nebude kupovat na 1080p. Dále si k efektivní propustnosti Infinity Cache připočtěme propustnost paměťové sběrnice, čímž získáváme celkovou datovou propustnost, jakou má GPU k dispozici. První řádek obsahuje údaje platné pro Navi 21 a říká nám, že pro Navi 31 potřebujeme zhruba trojnásobek hodnoty 1744 GB/s:
kapacita IC | fyzická propustn. IC | hit-rate a efektivní propustnost IC pro 4k rozlišení | GDDR6 (256bit) takt a propustnost | celková propustnost | vs. N21 | ||
---|---|---|---|---|---|---|---|
128 MB | 1987 GB/s | 62 % | 1232 GB/s | 16 GHz | 512 GB/s | 1744 GB/s | 1,0× |
256 MB | 1987 GB/s | 75 % | 1490 GB/s | 18 GHz | 576 GB/s | 2066 GB/s | 1,2× |
256 MB | 3974 GB/s | 75 % | 2981 GB/s | 18 GHz | 576 GB/s | 3557 GB/s | 2,0× |
512 MB | 1987 GB/s | 82 % | 1629 GB/s | 18 GHz | 576 GB/s | 2205 GB/s | 1,3× |
512 MB | 3974 GB/s | 82 % | 3259 GB/s | 18 GHz | 576 GB/s | 3835 GB/s | 2,2× |
512 MB | 7948 GB/s | 82 % | 6517 GB/s | 18 GHz | 576 GB/s | 7093 GB/s | 4,1× |
384 MB | 5961 GB/s | 79 % | 4709 GB/s | 18 GHz | 576 GB/s | 5285 GB/s | 3,0× |
Ostatní řádky obsahují různé hypotetické možnosti (zůstávejme u předpokladu, že taktovací frekvence Infinity Cache se nijak výrazně nezmění a měnit se bude kapacita a s ní související šířka její sběrnice a hit-rate). V první řadě vidíme, že osazením 256MB kapacity s dvojnásobnou přenosovou rychlostí dosahujeme ~2× vyšší datové propustnosti oproti Navi 21, což bych nepokládal za dostatečné. Pravděpodobně tedy půjde o kapacitu vyšší než 256 MB. Při hodnotě 512 MB by připadaly v úvahu tři uvedené hodnoty - v závislosti na tom, zda by se šířka sběrnice Infinity Cache odvíjela lineárně od kapacity, nebo by zůstala nižší. Celková datová propustnost 2,2× nad Navi 21 by mohla v kombinaci s 3× vyšším aritmetickým a texturovacím výkonem k dosažení FPS až 2,7-2,8× nad Navi 21, ale stále by to bylo docela těsné (pokud tedy AMD paralelně s tímto řešením neimplementuje i další technologie pro úsporu šířky pásma). Naopak při plném škálování 512MB kapacity by mohlo být dosaženo mezigeneračního posunu 4,1×, což se zase zdá být zbytečné. Zlatou střední cestou by byla 384MB Infinity Cache, která v kombinaci s 18GHz GDDR6 dosahuje přesného trojnásobku datové propustnosti oproti současnému řešení.
Je však možné, že do hry vstoupí proměnné, o kterých nevíme. Např. AMD změní takt Infinity Cache 512MB kapacita bude v kombinaci s nimi dávat větší smysl než 384MB. Každopádně jedna z těchto dvou hodnot se jeví jako velmi pravděpodobná.
Podle starších informací leakera Bondrewd je možné, že Infinity Cache, která má být součástí tzv. 6nm MCD řešení (které bude propojovat dva 5nm GCD čiplety), nebude monolitická. MCD, propojka čipletů integrující Infinity Cache, by podle této verze mohla být rozdělena do více menších kousků křemíků, jakýchsi aktivních můstků. To by pak výrazně snížilo náklady na výrobu propojovacího čipletu (nebyl by zapotřebí jeden velký monolit), na druhé straně by takové řešení vyžadovalo sofistikovanější metody pouzdření. Vydání architektury RDNA 3 se očekává zhruba za rok, dostupnost top modelu Navi 31 však podle posledních zpráv sklouzne spíše do prvního kvartálu 2023.