Diit.cz - Novinky a informace o hardware, software a internetu

AMD s Navi 31 cílila na trojnásobek Navi 21; dosáhne ~75 TFLOPS

Když se AMD rozhodovala o podobě GPU Navi 31, dala si vysoce ambiciózní cíl dosáhnout trojnásobku stávajícího top modelu, Navi 21…

Podle exkluzivních informací redakce webu RedGamingTech, se s architekturou RDNA 3 v začátcích jejího vývoje rozhodla AMD dosáhnout trojnásobku toho, kam se dostala s RDNA 2 (Navi 21). Navi 21 (Radeon RX 6900 XT) přitom cílila na dvojnásobek výkonu Navi 10 (Radeon RX 5700 XT). Dvojnásobek nebo trojnásobek se může z laického pohledu jevit jako malý rozdíl, opak je však pravdou. S Navi 21 šlo o dvojnásobek a především nešlo o dvojnásobek výkonu high-endu předchozí generace, ale dvojnásobek výkonu produktu na pozici mezi mainstreamem a high-endem, tedy segmentem občas označovaným jako midrange. Byl tu navíc velký prostor pro optimalizace taktovacích frekvencí (Navi 10 nebyla v tomto ohledu výrazně nad poslední generací Vegy) a byl tu velký potenciál v podobě nasazení Infinity Cache.

Navi 21 se zvýrazněnou Infinity Cache

Tím se AMD podařilo dosáhnout z tehdejšího pohledu velmi výrazného posunu, který překvapil i Nvidii, která na poslední chvíli upravovala specifikace karet - napřílad GeForce RTX 3080 namísto druhého nejvýkonnějšího herního GPU postavila na top modelu.

Navi 31 s architekturou RDNA 3 je v tomto ohledu ještě ambicióznější, neboť si AMD za cíl této generace nastavila trojnásobek Navi 21. Frekvenční optimalizace jsou z velké části vyčerpané, hlavní výhoda Infinity Cache již byla využitá a tentokrát jde navíc o trojnásobek oproti top modelu, nikoli midrange segmentu. Prostor tedy budou nejspíš vytvářet hlavně čiplety a 5nm proces. Infinity Cache už bude mít jen evoluční vliv, byť výrazný.

Informace o 2,5-násobku a později 2,7-násobku výkonu Navi 31 oproti Navi 21 pak měla odpovídat reálně srovnávanému výkonu, jak se AMD postupně dařilo řešit bugy, využívat rezervy a ladit návrh. V současnosti má být dosaženo koeficientu až 2,8×, což je hodnota velmi blízká teoretickému trojnásobku.

Navi 31 by podle téhož zdroje měla dosahovat aritmetického výkonu kolem 75 TFLOPS; tuto hodnotu si můžete porovnat se stávajícími modely:

  • Radeon RX 6700 XT: 13,2 TFLOPS
  • Radeon RX 6800: 16,2 TFLOPS
  • Radeon RX 6800 XT: 20,7 TFLOPS
  • Radeon RX 6900 XT: 23,0 TFLOPS
  • (Radeon RX 6900 XT LC OEM: 24,9 TFLOPS)

Pro dosažení FPS blízkých trojnásobku ovšem nestačí mít jen trojnásobný aritmetický výkon. Je zapotřebí ztrojnásobit i výkon texturovací (což půjde nejspíš ruku v ruce s výkonem aritmetickým) a dále tomuto cíli musí být uzpůsoben i výkon rasterizační a paměťová propustnost. Navi 21 disponuje 128 ROP jednotkami, což byl dvojnásobek oproti Navi 10 (64). Osobně se domnívám, že 64 ROP Navi 10 i 128 ROP Navi 21 bylo malinko více, než karty s tímto výkonem dokázaly plně využít a že by tedy AMD v případě Navi 31 nemusela osadit trojnásobek ROP (tj. 384), ale že by mohl stačit dvojnásobek, 256. To ale není více než jen osobní odhad.

18GHz GDDR6 se v současnosti používají u nejdražších OC modelů Radeonu RX 6900 XT

Možná zajímavější úvaha se váže k paměťové propustnosti. Je známo, že Navi 31 zůstane u 256bit sběrnice a dále že zůstane i u GDDR6 pamětí. Tím pádem je maximální teoretický možný posun paměťové propustnosti dán přechodem ze 16GHz na 18GHz moduly. To je 12,5% posun. Jenže pro zajištění cíleného výkonu samozřejmě nemůže stačit posun propustnosti na úrovni desítek procent, je zapotřebí posun řádově v násobcích. Což musí zajistit Infinity Cache.

Níže uvedená tabulka rekapituluje hodnoty získané a odvozené z materiálů, které AMD uvolnila při vydání architektury RDNA 2. Vyjadřuje především efektivní propustnost Infinity Cache při různých kombinacích její kapacity a cílového rozlišení:

 fyzická
propustn.
IC
plocha
IC***
hit-rate a efektivní propustnost IC (GB/s)
1920×10802560×14403840×2160
8 MB124 GB/s8 mm²25 %3117 %2114 %17
12 MB186 GB/s12 mm²31 %5819 %3515 %28
16 MB248 GB/s16 mm²37 %9225 %6217 %42
24 MB373 GB/s24 mm²48 %17931 %11624 %90
32 MB497 GB/s32 mm²55 %27339 %19426 %129
48 MB745 GB/s48 mm²66 %49249 %36534 %253
64 MB993 GB/s64 mm²72 %71559 %58641 %407
96 MB1490 GB/s96 mm²78 %116266 %98352 %775
128MB1987 GB/s128 mm²81 %160974 %147062 %1232

Zapomeňme na všechny řádky tabulky, kromě posledního, pro 128MB kapacitu, která se týká současného top-modelu, Navi 21. Zůstaňme pouze u 4k rozlišení (3840×2160) - pokud jde o high-end příští generace, nikdo si ho nejspíš nebude kupovat na 1080p. Dále si k efektivní propustnosti Infinity Cache připočtěme propustnost paměťové sběrnice, čímž získáváme celkovou datovou propustnost, jakou má GPU k dispozici. První řádek obsahuje údaje platné pro Navi 21 a říká nám, že pro Navi 31 potřebujeme zhruba trojnásobek hodnoty 1744 GB/s:

kapacita
IC 
fyzická
propustn.
IC
hit-rate a efektivní
propustnost IC
pro 4k rozlišení
GDDR6
(256bit)
takt a propustnost
celková
propustnost
vs.
N21
128 MB1987 GB/s62 %1232 GB/s16 GHz512 GB/s1744 GB/s1,0×
256 MB1987 GB/s75 %1490 GB/s18 GHz576 GB/s2066 GB/s1,2×
256 MB3974 GB/s75 %2981 GB/s18 GHz576 GB/s3557 GB/s2,0×
512 MB1987 GB/s82 %1629 GB/s18 GHz576 GB/s2205 GB/s1,3×
512 MB3974 GB/s82 %3259 GB/s18 GHz576 GB/s3835 GB/s2,2×
512 MB7948 GB/s82 %6517 GB/s18 GHz576 GB/s7093 GB/s4,1×
384 MB5961 GB/s79 %4709 GB/s18 GHz576 GB/s5285 GB/s3,0×

Ostatní řádky obsahují různé hypotetické možnosti (zůstávejme u předpokladu, že taktovací frekvence Infinity Cache se nijak výrazně nezmění a měnit se bude kapacita a s ní související šířka její sběrnice a hit-rate). V první řadě vidíme, že osazením 256MB kapacity s dvojnásobnou přenosovou rychlostí dosahujeme ~2× vyšší datové propustnosti oproti Navi 21, což bych nepokládal za dostatečné. Pravděpodobně tedy půjde o kapacitu vyšší než 256 MB. Při hodnotě 512 MB by připadaly v úvahu tři uvedené hodnoty - v závislosti na tom, zda by se šířka sběrnice Infinity Cache odvíjela lineárně od kapacity, nebo by zůstala nižší. Celková datová propustnost 2,2× nad Navi 21 by mohla v kombinaci s 3× vyšším aritmetickým a texturovacím výkonem k dosažení FPS až 2,7-2,8× nad Navi 21, ale stále by to bylo docela těsné (pokud tedy AMD paralelně s tímto řešením neimplementuje i další technologie pro úsporu šířky pásma). Naopak při plném škálování 512MB kapacity by mohlo být dosaženo mezigeneračního posunu 4,1×, což se zase zdá být zbytečné. Zlatou střední cestou by byla 384MB Infinity Cache, která v kombinaci s 18GHz GDDR6 dosahuje přesného trojnásobku datové propustnosti oproti současnému řešení.

Je však možné, že do hry vstoupí proměnné, o kterých nevíme. Např. AMD změní takt Infinity Cache 512MB kapacita bude v kombinaci s nimi dávat větší smysl než 384MB. Každopádně jedna z těchto dvou hodnot se jeví jako velmi pravděpodobná.

Podle starších informací leakera Bondrewd je možné, že Infinity Cache, která má být součástí tzv. 6nm MCD řešení (které bude propojovat dva 5nm GCD čiplety), nebude monolitická. MCD, propojka čipletů integrující Infinity Cache, by podle této verze mohla být rozdělena do více menších kousků křemíků, jakýchsi aktivních můstků. To by pak výrazně snížilo náklady na výrobu propojovacího čipletu (nebyl by zapotřebí jeden velký monolit), na druhé straně by takové řešení vyžadovalo sofistikovanější metody pouzdření. Vydání architektury RDNA 3 se očekává zhruba za rok, dostupnost top modelu Navi 31 však podle posledních zpráv sklouzne spíše do prvního kvartálu 2023.

Diskuse ke článku AMD s Navi 31 cílila na trojnásobek Navi 21; dosáhne ~75 TFLOPS

Úterý, 19 Říjen 2021 - 07:34 | Petr Derryk | Není potřeba stavět nějaký benchmark. Pro CPU...
Středa, 13 Říjen 2021 - 21:45 | tombomino | "Protimonopolný úrad USA transakciu schválil...
Středa, 13 Říjen 2021 - 20:39 | Peter Fodrek | Protimonopolný úrad USA transakciu schválil (...
Středa, 13 Říjen 2021 - 19:37 | Ladis | Jistě, ale jen ve *starých hrách*. Těch co...
Středa, 13 Říjen 2021 - 19:36 | RedMaX | Panove, zkouknete testy, vyzkousejte to pripadne...
Středa, 13 Říjen 2021 - 19:30 | Ladis | Protože tahat data z VRAM nebo RAM je stejně...
Středa, 13 Říjen 2021 - 19:29 | Mat Rio | Já mám taky na iGPU nastaveno jen 512MB, ale...
Středa, 13 Říjen 2021 - 19:23 | Ladis | Tak pro hry to je, to jsem psal výše (APU Xboxu...
Středa, 13 Říjen 2021 - 19:18 | Mat Rio | Já to myslel přesně naopak. Použít X-Box jako...
Středa, 13 Říjen 2021 - 16:50 | franzzz | Ja sam obcas hraju na svoji iGPU, ktera ma...

Zobrazit diskusi