Co dál s Infinity Cache? Vypadá to na notebooky a APU. A co HBM?
O Infinity Cache jsme poprvé mohli slyšet díky redakci webu RedGamingTech. Když zveřejnila, že AMD něco takového pro RDNA2 / Navi 21 plánuje, málokdo tomu věřil. Ono není divu. Nějaká forma velké cache (eDRAM, EDRAM, ESRAM, SRAM…) se ve spekulacích o desktopových grafikách objevuje opakovaně již přes dvě dekády, ale nepotvrdila se (až dosud) nikdy. Když se po téměř čtvrt století stále dokola potvrzuje, že takové řešení není průchozí, tak v něj zkrátka věří málokdo. Proto se k němu mnoho osob, včetně lidí skutečně znalých, dlouho stavělo skepticky a to i navzdory indiciím, jakými byly patenty, útržky kódu, registrace ochranné známky a zvěsti o 256bit sběrnici Navi 21, která by sama o sobě na kartu o high-endovém výkonu nestačila
Pro řadu lidí tak potvrzení na oficiálním streamu AMD Where Gaming Begins bylo stále překvapením a jejich mozková kapacita (se vší úctou!) byla zaměstnána tím, aby se s překvapením vyrovnala, namísto toho, aby se věnovala možnostem tohoto řešení. Je pravdou, že zatím neznáme detaily implementace a fungování Infinity Cache. Z grafu promítaného na streamu ale bylo možné odvodit, jaké datové propustnosti cache dosahuje, což následně potvrdila AMD na webu:
256bit GDDR6 sběrnice společně s Infinity Cache dosahuje propustnosti 1664 GB/s. Propustnost samotné 256bit sběrnice s 16GHz GDDR6 je 512 GB/s, takže pro Infinity Cache zbývá 1152 GB/s.
Včerejší spekulace:
Z taktovacích frekvencí pak můžeme usoudit, že této propustnosti je dosahováno na 2250 MHz, což je maximální referenční takt Navi 21 a že pro dosažení této propustnosti při daném taktu je nutná (1152 × 8 × 1000 / 2250 =) 4096bit sběrnice.
Realita:
Nakonec se ukázalo, že hodnota 1152 GB/s není teoretická maximální datová propustnost Infinity Cache, ale reálně dosahovaná typická hodnota (tedy se započtením 58% hit-rate, viz níže) při 1940 MHz a situace se má takto: (1152 × 8 × 1000 / 1940) / 0,58 = 8192 bit sběrnice. Sběrnice se skládá z 16 64B kanálů Infinity Fabric spojujících Infinity Cache a grafické jádro.
Teoretická maximální datová propustnost Infinity Cache tedy odpovídá ~2 TB/s, ale při typickém využití je efektivně dosahováno ~1,2 TB/s.
Oficiální informací je nicméně údaj (červeně zvýrazněno, výše), že ve 4k rozlišení v nejnovějších hrách je hit-rate Infinity Cache 58 %. Což znamená, že zhruba v 60 % případů se potřebná komunikace podaří vyřešit s použitím Infinity Cache a zhruba ve 40 % případů je potřeba sáhnout do grafické paměti. Tento poměr zhruba odpovídá poměru propustnosti Infinity Cache (69 %) a GDDR6 (31 %), což dává smysl.
Infinity Cache ale nemá smysl považovat za prvek vázaný ne (nebo exkluzivní pro) GPU Navi 21. Podle aktuálních informací to dokonce vypadá, že ani nevznikla kvůli tomuto GPU, pouze že je toto GPU prvním produktem, který ji využívá. Důvodem měla být snaha o zúžení paměťové sběrnice pro mobilní grafické čipy. Šířka sběrnice je v mobilním segmentu problém, vyžaduje plochu PCB a ta je v noteboocích čím dál více omezená. AMD má z hlediska plochy PCB výborné řešení - paměti HBM, díky nimž je sběrnice integrována do pouzdra čipu. Navíc mají příznivý vliv na spotřebu. Jenže stojí něco navíc a ne každý zákazník za ně chce připlácet. Nemůžeme ale tvrdit, že zájem o HBM ve spotřebním segmentu není, například Apple má o produkty s HBM zájem. K HBM se ještě vrátíme - prozatím ale zůstaňme u konstatování, že tyto paměti nejsou řešením pro všechny cenové hladiny mobilního trhu.
Právě pro řešení této situace měla vzniknout Infinity Cache. V praxi to znamená, že se s ní nejspíš setkáme i u menších GPU než je Navi 21, protože zrovna Navi 21 jistě nebude onen produkt určený primárně pro notebooky.
Další zajímavou informací je, že Infinity Cache najde místo i v rámci APU. Dává to smysl. Výkon integrovaných grafik nemá smysl zvyšovat, pokud a dokud není k dispozici vyšší datová propustnost. Při zhruba 60% hit-rate lze spekulovat o tom, že 128MB Infinity Cache má potenciál zvýšit efektivní datovou propustnost až na 2,5násobek současné situace, takže dá prostor pro až 2,5násobný výkonnostní nárůst ve srovnání s možnostmi současné Vega+. Druhá věc samozřejmě je, že v případě APU nebude kapacita patrně 128MB, ale nižší. Tato by APU příliš prodražila a navíc asi nikdo nebude od APU očekávat hraní ve 4k rozlišení, pro které podle všeho AMD kapacitu v případě Navi 21 nastavila.
V tuto chvíli samozřejmě nevíme, u kterého APU bude Infinity Cache debutovat. Zda ji nabídne již ultramobilní Van Gogh (cca 7-15 wattů), nebo to bude standardní Rembrandt (cca 15-65 wattů), který dorazí za rok a něco. V obou případech jsme ve článcích o těchto APU upozornili na podezřelý nárůst plochy jádra, který jde nad rámec očekávaného počtu procesorových jader a konfigurace integrované grafiky:
- APU Van Gogh: Čtyři jádra Zen 2, RDNA2, přehrávání AV1
- APU Rembrandt (Zen 3 + RDNA2) se vrací nad 200 mm²
Diskutéři, kteří vyjádřili pod článkem názor, že by svůj podíl na této ploše mohla mít Infinity Cache, by měli zpozornět, neboť nejspíš nebyli daleko od pravdy. V případě Navi 21 zabírá Infinity Cache asi 15,7 % plochy jádra, což bude nějakých 79-84 milimetrů čtverečních. Pro APU lze počítat spíše s 25 % této hodnoty, tedy s 20 milimetry čtverečními. Čtvrtina kapacity (32 MB) pro čtvrtinové rozlišení (1920×1080 oproti 3840×2160) by měla stačit (pokud nám nechybí nějaká zásadní informace, bez které není možné odhad provést).
Kapacita jako 64 MB by mohla najít uplatnění u grafických karet zaměřených na 2560×1440, tedy nejspíš GPU Navi 22, což bude patrně jeden z produktů, který najde uplatnění v noteboocích a kvůli kterému právě Infinity Cache vznikla. Navi 23, bude-li produktem se 128bit sběrnicí (v souladu se současným očekáváním), by pak mohla nést 32-48 MB.
Výše ve článku jsem zmínil, že se ještě vrátíme k HBM. V předcházejících týdnech se objevovaly útržky kódu, které popisovaly Navi 21 jako GPU s rozhraním GDDR6 i jako GPU s rozhraním HBM. AMD dosud zveřejnila pouze editovaný snímek jádra, nicméně i tyto editované snímky v základních rysech odrážejí realitu. Na obrázku výše stojí za povšimnutí dva navazující pruhy při levém okraji jádra. Může jít o leccos, ale převažájí dva názory a to, že jde buďto o rozhraní xGMI (Infinity Fabric link) nebo 1024bit kanály HBM. Spolehlivě nejde vyvrátit ani potvrdit ani jedno, neboť pracujeme se schematizovaným grafickým zpodobněním jádra, nikoli s mikrosnímkem.
Stojí ale za úvahu, proč by AMD jádro vybavila jako GDDR6 sběrnicí, tak HBM(2) sběrnicí. Je možné, že společnost počítá s nějakou zakázkou například pro Apple, kde by se uplatnila verze osazená HBM2, která dále zmenší plochu potřebou pro implementaci GPU. Při osazení standardních 2GHz HBM2 by bylo dosaženo stejné propustnosti jako u verze s 256bit 16GHz GDDR6, tedy 512 GB/s. Při osazení 2,4 GHz čipů by již šlo o 614,4 GB/s, tedy 20 % navíc. Výrobci pamětí však avizovali i rychlejší HBM2 čipy.
Druhou možností - stále za předpokladu, že podlouhlá rozhraní znázorňují kanály HBM a nikoli xGMI - je, že si AMD nechává rezervu pro ultra-high-end model, nějaký Radeon RX 6900 XTX, Radeon RX 6950 XT či případně půlgenerační refresh v rámci řady Radeon RX 7000, který by zvýšil datovou propustnost osazením HBM a společně s vyššími takty dal jádru Navi 21 druhý dech.
Varianta hypotézy zastávající xGMI by znamenala, že Navi 21 může najít uplatnění v profesionálním segmentu, kde by GPU mohlo být přímo spojeno s jinými čipy vybavenými tímto rozhraním.