Navi 31: 4 TB/s k Infinity Cache a 1 TB/s k GDDR6
Někteří leakeři očekávají, že Navi 31 bude vypadat zhruba tak, jak je znázorněno na schematu níže. Uprostřed (červeně) GCD, tedy 5nm čiplet s výpočetními bloky (v tomto pojetí i s PCIe, front-endem, multimédii, obrazovými výstupy ap.) a kolem GCD je umístěno šest 6nm čipletů integrujících paměťové rozhraní (64bit blok v každém) a Infinity Cache. Čiplety vzájemně propojuje 65nm wafer. Již ne klasický křemíkový interposer limitovaný rozměry čipu (tzv. reticle limit, max. cca 860 mm²), ale část waferu, která může být osvícena dvakrát (reticle limit je tedy dvojnásobný, cca 1700 mm²).
Údajná podoba Navi 31; zdroj: AMDGPU
Datová propustnost mezi GCD a MCD (spojenými přes CoWoS) by měla dosahovat 4 TB/s. Každé MCD by mělo nést 64 MB SRAM (Infinity Cache), což by odpovídalo celkem 384 MB. Nutno podotknout, že existují i zmínky o 192 MB a lze stále narazit i na údaj 256 MB (i ten je z technologického hlediska realizovatelný, v takovém případě by šlo o 48 MB SRAm na MCD).
Základní otázkou je, jakou bude mít Navi 31 k dispozici efektivní paměťovou propustnost. Jasná je fyzická propustnost paměťové sběrnice: 384 bitů v kombinaci s GDDR6 znamená (podle konkrétních čipů - 16-18-21GHz) 768-864-1008 GB/s. Jaké čipy AMD osadí, není jisté, leakeři se rozcházejí. Nejspíš existují vzorky s různými pamětmi. Podstatnější bude, kolik k efektivní paměťové propustnosti přidá Infinity Cache.
fyzická propustn. IC | plocha IC | hit-rate a efektivní propustnost IC (GB/s) | ||||||
---|---|---|---|---|---|---|---|---|
1920×1080 | 2560×1440 | 3840×2160 | ||||||
8 MB | 124 GB/s | 5 mm² | 25 % | 31 | 17 % | 21 | 14 % | 17 |
12 MB | 186 GB/s | 7 mm² | 31 % | 58 | 19 % | 35 | 15 % | 28 |
16 MB | 248 GB/s | 10 mm² | 37 % | 92 | 25 % | 62 | 17 % | 42 |
24 MB | 373 GB/s | 15 mm² | 48 % | 179 | 31 % | 116 | 24 % | 90 |
32 MB | 497 GB/s | 20 mm² | 55 % | 273 | 39 % | 194 | 26 % | 129 |
48 MB | 745 GB/s | 29 mm² | 66 % | 492 | 49 % | 365 | 34 % | 253 |
64 MB | 993 GB/s | 39 mm² | 72 % | 715 | 59 % | 586 | 41 % | 407 |
96 MB | 1490 GB/s | 59 mm² | 78 % | 1162 | 66 % | 983 | 52 % | 775 |
128MB | 1987 GB/s | 79 mm² | 81 % | 1609 | 74 % | 1470 | 62 % | 1232 |
Abychom se dopočetli nějakého výsledku, můžeme začít u tabulky, kterou jsem připravil loni na základě slajdu s grafem AMD, který vyjadřoval závislost hit-rate na rozlišení a kapacitě Infinity Cache v podobě, jaká byla použitá na RDNA 2.
Extrapolací zjišťujeme, že při použití 192MB Infinity Cache by hit-rate dosahoval zhruba asi 67 % a při 384MB kapacitě asi 78 %. Beru v potaz 4K rozlišení. Pokud má být datová propustnost čipletové Infinity Cache celkem 4096 GB/s, pak by při hit-rate 67 % poskytovala asi 2744 GB/s a při 78% hit-rate přibližbě 3195 GB/s.
efektivní datová propustnost (GDDR6+IC) | 192MB IC (2744 GB/s) | 256MB IC (3072 GB/s) | 384MB IC (3195 GB/s) |
---|---|---|---|
16Gb/s GDDR6 @384bit (768 GB/s) | 3512 GB/s | 3840 GB/s | 3963 GB/s |
18Gb/s GDDR6 @384bit (864 GB/s) | 3608 GB/s | 3936 GB/s | 4059 GB/s |
21Gb/s GDDR6 @384bit (1008 GB/s) | 3752 GB/s | 4080 GB/s | 4203 GB/s |
Efektivní datová propustnost by tedy byla zhruba kolem 3,5-4,2 TB/s. Připomeňme, že Radeon RX 6900 XT (Navi 21) disponoval 512 GB/s (GDDR6) + efektivní propustností (4K) Infinity Cache 1152 GB/s, tedy celkem 1664 GB/s efektivně. Pokud by cílem Navi 31 byl 2,5× vyšší výkon (×Radeonu RX 6900 XT), pak by při zohlednění celkově nižších nároků architektury na datovou propustnost (vylepšená podpora delta-komprese) a 384bit sběrnici stačila nejspíš i kombinace základní 16GHz GDDR6 se 192MB kapacitou Infinity Cache (tj. 3512 GB/s efektivně celkem). 384MB varianta se tak jeví prakticky jako plýtvání (když se pohybujeme v takto vysokých kapacitách, znamená už zdvojnásobení kapacity pouze 12-13% nárůst efektivní datové propustnosti).
Přestože většina zdrojů aktuálně hovoří o 384 MB, osobně nevidím důvod, proč by si čip nevystačil se 192 MB (6× 32 MB) nebo 256 MB (6× 48 MB).