Rembrandt: až 2,6× efektivnější než Alder Lake, graficky 77 % nad GeForce MX450
V lednu na CES ohlásila AMD mobilní modely APU Rembrandt, které a 6nm procesu TSMC kombinuje procesorová jádra Zen 3+ a grafiku RDNA 2. Bude k dispozici ve verzích pro 15-28W TDP („U“), 35W TDP („HS“), 45W TDP („H“) a 45W+ TDP („HX“).
Nyní v únoru vycházejí notebooky osazené 35W modely (řada HS). V první polovině března budou následovat výkonné HX/H a úsporné U. Druhá polovina března se zaměři na profesionální modely.
Jen pro připomenutí přikládám slajd se specifikacemi (těm jsme se již věnovali v lednu) a rovnou přejděme k rozdílům mezi 7nm APU Cezanne (vlevo) a 6nm Rembrandt (vpravo):
Paměťový řadič byl rozdělen ze dvou 64bit bloků na čtyři 32bit (subkanály), což umožňuje efektivněji zacházet s úspornými LPDDR pamětmi. Podporovány jsou DDR5-5200 i LPDDR5-6400, což znamená o 50-63 % vyšší datovou propustnost řadiče oproti předchozí generaci. GPU se posunulo jak architektonicky (prakticky o dvě generace, Vega -> RDNA 2), tak počtem CU bloků (8->12), dále počtem ROP jednotek (8->16) i kapacitou L2 cache (1->2 MB).
Přibyl bezpečnostní koprocesor Microsoft Pluton, v jehož důsledku je Rembrandt prvním x86 procesorem plně podporujícím režimy zabezpečení Windows 11. Řadič obrazových výstupů podporuje čtyři nezávislé monitory (tzn. např. displej notebooku + 3 pracovní plochy) a výstupy v podobě HDMI 2.1 a DisplayPort 2.0 (k tomu se ještě vrátíme). Z multimediálních akcelerátorů povýšilo VCN na verzi 3.1, která zahrnuje například AV1 kodek pro 8K video. Upgradu se dočkal i audioprocesor, který (opět jako první v x86 světě) podporuje hardwarovou redukci šumu, takže funkce využívaná např. při videokonferencích může být prováděna hardwarově s nižšími energetickými nároky.
Aktualizována byla i komunikační rozhraní. PCIe 3.0 na PCIe 4.0 (vč. NVME), USB 3.1 na USB 4.0, přibylo i rozhraní pro bezdrátovou správu.
Energetické optimalizace
Velkého rozšíření se dočkaly technologie pro řízení spotřeby. Je toho opravdu hodně, takže vypíchneme jen to nejpodstatnější nebo nejzajímavější. CPPC (Collaborative Processor Performance Control) se posouvá o další krok a je schopný hlásit operačnímu systému zatížení nikoli na úrovni jádra, ale vlákna. APU je jemněji rozděleno na úseky, které mají nezávislé řízení spotřeby. To znamená: jednotlivě pro každé x86 jádro, pro GPU, pro řadič obrazových výstupů, pro systémovou sběrnici, pro integrovaný čipset, pro Z-state část. Je přítomna hardwarová akcelerace přechodů mezi režimy výkonu a nízké spotřeby. Je možné převádět do režimu spánku větší části křemíku, když nejsou využívané (např. při přehrávání videa). APU může využívat milisekundy, po které není vytížené, k přechodům do režimů nižší spotřeby.
APU nově využívá PMF (Power Management Framework), který interně disponuje profilem pro tichý chod, vyváženým profilem a profilem pro maximální výkon. Na základě dat z nových vstupních a výstupních trackerů analyzuje, jakého charakteru je aktuální zátěž a jak se zátěž mění. Podle toho automaticky přepíná mezi těmito profily, takže uživatel benefituje z výhod tichého profilu i výkonného profilu, aniž by je musel manuálně přepínat ve Windows.
Grafické jádro
Popisu novinek grafického jádra RDNA 2 jsme se již věnovali, takže jen shrnutí: 1,5× více CU (SP+TMU), 2× více ROP, 1,5-1,6× vyšší datová propustnost systémové sběrnice a 2× větší L2 cache.
Ve srovnání s nejvýkonnějším dostupným integrovaným GPU Intelu postaveném na nových / náročných hrách v 1920×1080 vychází APU Rembrandt o 80 % rychlejší. Podstatnější než samotné procento je snímková frekvence, která s využitím FreeSync umožňuje udržet plynulý obraz v herní zátěži integrovaným GPU ultrathin notebooku.
Ve srovnání se samostatnou GeForce MX450 je integrovaný Radeon v průměru o 77 % výkonnější, přičemž srovnání proběhlo na 28W TDP (pro celé APU), což je méně než součet TDP libovolného mobilního procesoru a GeForce MX450.
AMD si ve srovnání troufá jít ještě dál a ukazuje, jak blízko (81 %) je nový integrovaný Radeon výkonu samostatné GeForce GTX 1650 Max-Q (která má v kombinaci se samostatný procesorem rovněž podstatně vyšší spotřebu než 28W APU)…
…přičemž s použitím RSR, které lze nově zapnout v ovladačích, lze tento rozdíl (samozřejmě částečně na úkor kvality) více než setřít. Grafik, který tento graf připravoval, by nicméně zasluhoval nakopat… křenu, protože už sloupce pro hru Deathloop jsou nestejně vysoké, přestože hodnota (73 FPS) je v obou případech stejná. Buďto je špatně zpracovaný graf, nebo jde o překlep v hodnotě (73 namísto 83), nebo nějaká kombinace obojího.
U slajdu shrnující konektivitu a multimediální výbavu bychom se mohli vrátit k DisplayPort 2.0. Ten přináší několik standardů, přičemž APU Rembrandt podporuje UHBR10 odpovídající přenosové rychlosti USB4 (USB 4.0), které právě umožňuje DisplayPort 2 protlačit. Je tedy podporována přenosová rychlost až 40 Gb/s, nikoli maximálních 80 Gb/s. Nedá se nicméně říct, že by 40 Gb/s (ještě v kombinaci s Display Stream Compression) bylo pro většinu uživatelů notebooku omezující - na tři 8K displeje by to mělo stačit.
Podporovány nejsou jen nové standardy jako takové, ale také úsporné vlastnosti některých typů displejů, které umí Rembrandt využít (samozřejmě v případě, že jde o systém vybavený daným typem displeje). Jde např. o funkce jako self-refresh, kdy není nutné displeji cyklicky posílat neměnná data, delta-kompresi (jsou aktualizovaná jen data pro části obrazu, které se mění), úpravu (snížení) obnovovací frekvence podle snímkové frekvence videa přehrávaného přes celou obrazovku aj.
AMD dále upozornila na jeden dlouhodobě opomíjený fakt a to, že v mobilním segmentu je propast mezi uváděným TDP a reálnými limity spotřeby ještě větší než v desktopu. 45W TDP u Intel Core i9-12900HK znamená reálně 115W dlouhodobý limit spotřeby (dle doporučení Intelu). V případě tohoto testu měl notebook Raider GE76 společností MSI limit nastaven na 110 wattů a notebook Zephyrus G14 měl pro 35W Ryzen 9 6900HS nastaven dlouhodobý limit spotřeby 35W. 45W Core i9-12900HK tak v testu CineBench dosahuje o 19 % vyššího skóre než 35W Ryzen 9 6900HS, ovšem při reálné spotřebě až 3,1× vyšší. Což znamená 2,6× vyšší energetickou efektivitu pro Ryzen 9 6900HS. Což je zajímavé s přihlédnutím k faktu, že jmenované Core disponuje 8 „energeticky efektivních“ jader.
V mezigeneračním srovnání dosahuje úsporný Ryzen 7 6800U oproti Ryzen 7 5800U až(!) o 17 % vyššího procesorového výkonu při 15W TDP a až o 37 % vyššího procesorového výkonu při 28W TDP. Při srovnání integrované grafiky jde prakticky o dvojnásobný náskok. Výdrž na baterii je při nastavení 15W TDP o 8-17 % vyšší. V případě 28W TDP je výdrž stejná jako u 15W TDP APU minulé generace.
Výše vidíte graf, kterým AMD velmi vtipně přistoupila na hru Intelu, který ve svých slajdech u příležitosti vydání procesorů Ice Lake a Tiger Lake srovnával vlastní procesory nastavené na 28W TDP s 15W APU AMD, ovšem tuto skutečnost v grafech neuváděl. AMD u takto nastavených podmínek zůstala (tedy 28W Core oproti 15W Ryzenu) a předkládá výkonnostní výsledky nového APU: 15W Ryzen 7 6800U dosahuje 1,14-1,42× vyššího procesorového výkonu než 28W Core a až 3× vyššího grafického výkonu.
Při 28W TDP pro Core i Ryzen 6000 (ovšem v některých případech v jiných úlohách) se výkonnostní rozdíl prohlubuje až o desítky procent.
Podobně je koncipované srovnání 65W Tiger Lake Core i9-11980HK s 45W Ryzen 9 6900HX. Sluší se připomenout, že mobilní Core řady HK mají reálný limit spotřeby nastaven obvykle nad 100 wattů i při základním 45W TDP (zde je TDP zvýšeno na 65W). 45W Ryzen 9 6900HX v testech procesorových jader překonává Core i9-11980HK o 8-47 %.
Zatím máme k dispozici pouze výsledky AMD, ale s ohledem na to, že v posledních letech nebývají nijak daleko od reality to vypadá, že se AMD podařilo vyrobit velmi zajímavý produkt i bez upgradu x86 architektury. Procesorovým jádrům byla zvýšena energetická efektivita, největším upgradem je nová grafika dosahující 2-3× vyššího výkonu (podle toho, zda srovnáváme s minulou generací nebo s konkurencí) a potěší i bohatá multimediální výbava a konektivita. Intel si nejspíš s top modely 12. generace odnese výkonnostní korunu procesorového výkonu, ovšem na úkor limitů spotřeby 2,5-3× vyšších, nad čímž se u mobilního procesoru oko příliš přimhouřit nedá.