Velká Navi ponese GDDR6, nikoli HBM2 a nejspíš nebude až tak velká
Pochází z YouTube kanálu Moore's Law Is Dead.
Krátká odbočka: V posledních pár letech vyrostlo YouTube kanálů, které přinášejí údajně exkluzivní obsah o nevydaném hardwaru, jako hub po dešti. Není divu. Každý, který přijde s pár bombastickými zprávami má za chvíli vysoké desítky tisíc odběratelů, každé video má podobný počet shlédnutí a pro jejich autora jde o solidní zdroj výdělku. Nelze se tedy divit, že takové kanály vznikají. Lze se však divit tomu, že některé z nich mají takovou sledovanost, jakou mají: S odstupem času se ukazuje, že všechny údajné exkluzivní informace si autor vycucal z prstu (v tom lepším případě :-) a obecenstvu pouze větší bulíky na nos, neboť tím má zajištěn spolehlivý zdroj příjmů. Ještě překvapivější může být, že mnozí odběratelé v případě kritiky věnují nemálo energie k obhajobě svého bulíkodárce.
Kanál Moore's Law Is Dead se alespoň snaží tvářit seriózněji (na nějaké objektivnější hodnocení ale bude potřeba časový odstup) a většina informací, které chrlí do světa, alespoň na první pohled nevypadá zcela nesmyslně. Tentokrát došlo na tzv. velkou Navi (Navi 21), produkt, který by měl AMD dostat v grafických kartách nad segment mainstreamu. Podle tohoto zdroje bude plocha GPU dosahovat 427 mm², nést 72 CU, tj. 4608 stream-procesorů (není jasné, zda jde o celkový počet stream-procesorů, nebo počet aktivních stream-procesorů) a 384bit sběrnici vybavenou pamětmi GDDR6. Herní takt se má pohybovat kolem 2,05 GHz, boost kolem 2,15 GHz.
V první řadě k ploše: Během jara se opakovaně objevoval údaj 505 mm², který přecijen více korespondoval s high-endovými ambicemi. Mohlo však jít pouze o spekulaci vycházející z jiné spekulace a to, že Navi 21 je konfigurací dvojnásobkem Navi 10. 2560 stream-procesorů ×2 = 5120 stream-procesorů, 64 ROP ×2 = 128 ROP. K tomu by bylo zapotřebí HBM rozhraní, neboť 256bit GDDR6 sběrnice by 128 ROP asi příliš nestačila a 384bit GDDR6 sběrnici by asi nebylo úplně banální ke 128 ROP připojit.
Zároveň ale existovala smysluplnější možnost, že by Navi 21 co do základní konfigurace nebyla přesným dvojnásobkem Navi 10, ale zdvojnásobil by se jen počet stream-procesorů, zatímco počet ROP by vzrostl pouze o 50 %, čemuž by stačila 384bit sběrnice. Této verzi lépe odpovídají zprávy od Moore's Law Is Dead. Jen s tím rozdílem, že nehovoří o 5120 stream-procesorech, ale o 4608 stream-procesorech. Lze ovšem připustit, že jich fyzicky bude více a 512 je deaktivovaných.
Není však uváděná plocha jádra - 427 mm² - příliš nízká? Dosud se mluvilo o více než 500 mm²…
Díky této otázce jsem se dokopal k návratu k rozboru snímku GPU Navi 10 a vypočítání, jaké plochy by dosahovalo jádro s popsanými parametry.
Předpokládejme variantu s fyzicky přítomnými 5120 stream procesory:
- Navi 10: 251 mm²
- +40 CU -> +83,6 mm²
- +32 ROP -> +8,8 mm²
- +128bit rozhraní -> +27,2 mm²
- +128bit řadič -> +8,4 mm²
- 2× větší L2 cache -> +12,0 mm²
- 2× větší L1 cache -> +12,8 mm²
- 2× větší front end / command processor -> +13,4 mm²
- celkem: ~417 mm²
Zda AMD zvolí plně dvojnásobnou L1/2 cache i komplet dvojnásobný front-end, popravdě netuším, takže tato hodnota bude spíše nadsazená. I s nadsazenými údaji je ale výsledek mírně nižší než 427 mm² uváděných zdrojem, takže zbývá prostor pro nějaká architektonická vylepšení. Co to znamená: Uvedené parametry a uvedená plocha jádra zhruba korespondují, takže není důvod předpokládat, že jde o smyšlené údaje.
Zdroj dále uvádí herní výkon 40-50 % nad GeForce RTX 2080 Ti. Takové číslo si opět zaslouží vlastní rozbor. Zvlášť proto, že je na první pohled nečekaně vysoké. Porovnejme si tedy uvedené parametry velké Navi (tentokrát 4608 stream-procesorů, protože nyní řešíme reálný výkon aktivního křemíku, nikoli plochu, kterou - i neaktivní - výbava jádra zabere) s parametry Navi 10 / Radeon RX 5700 XT:
Navi 10 (Radeon RX 5700 XT) | Navi 21 | rozdíl | |
---|---|---|---|
plocha | 251 mm² | 427 mm² | +70 % |
stream-procesorů | 2560 | 4608 | +80 % |
základní takt | 1605 MHz | ? | ? |
herní takt | 1755 MHz | 2050 MHz | +17 % |
boost | 1905 MHz | 2150 MHz | +13 % |
FP32 | 9,0 TFLOPS | 19,0 TFLOPS | +111 % |
ROP | 64 | 96 | +50 % |
fillrate | 112,3 GPxl/s | 196,8 GPxl/s | +75 % |
sběrnice | 256bit | 384bit | +50 % |
paměti | 14GHz GDDR6 | 16GHz(?) GDDR6 | +14 % |
propustnost | 448 GB/s | 768 GB/s | +71 % |
Podstatné jsou tři hodnoty: Nárůst FP32 výkonu (který odpovídá i nárůstu texturovacího výkonu), nárůst fillrate a nárůst datové propustnosti. Aritmetický (FP32) výkon a texturovací výkon díky vyššímu počtu CU a vyššímu hernímu taktu stoupnou o 111 %. Fillrate díky vyššímu počtu ROP a vyššímu hernímu taktu stoupne o 75 % a datová propustnost díky širší sběrnici a patrně rychlejším 16GHz pamětem stoupne docela adekvátně, o 71 %.
To znamená, že nárůsty výkonu oproti Radeonu RX 5700 XT by měly dosahovat přinejmenším kolem 70 % a přinejlepším kolem 110 %. Řekněme, že v průměru přinese o 85-90 % výkonu navíc (samozřejmě v situacích limitovaných výkonem grafické karty, nikoli procesoru). V takovém scénáři (např. 4k rozlišení) dosahuje GeForce RTX 2080 Ti o 54 % vyššího výkonu než Radeon RX 5700 XT:
zdroj: ComputerBase
Pokud budeme výkon GeForce RTX 2080 Ti brát jako 100 %, pak výkon velké Navi vychází o 20-25 % vyšší. Tedy 120-125 % GeForce RTX 2080 Ti. Má-li být dosaženo ještě 15-25 % navíc, muselo by dojít k velmi výraznému zvýšení efektivity architektury RDNA->RDNA2. Určitý posun možný je, ale osobně bych nečekal více než 5-10 %. Je však možné, že při srovnání velké Navi a GeForce RTX 2080 Ti nebyla použita Founders Edition (ze které pochází výsledky v grafu výše), ale pomalejší základní verze a k tomu sada her, které lépe Navi sedí.
Výkon na úrovni 140-150 % GeForce RTX 2080 Ti bych ale od 427mm² čipu s 4608 stream-procesory v nezávislých recenzích neočekával. S těmito parametry by bylo realistické očekávat zhruba čtvrtinové překonání GeForce, optimistické očekávání by byla třetina nad GeForce a cokoli vyššího by byl zázrak dostačující pro kanonizaci CEO AMD.
via Guru 3D