Zen 5 APU Strix Point a Sarlak - nové informace
Úvodem připomeňme, že APU Strix Point je standardní APU, které by mělo být vydané někdy po desktopové variantě Zen 5. O konkrétních datech se vedou dohady, ale pokud Zen 5 pro desktop dorazí na přelomu května a června, pak by Strix Point mohl následovat někdy v létě, řekněme v srpnu. Zkrátka bez ohledu na konkrétní datum vydání Zen 5 (může se ještě leccos změnit) lze očekávat zhruba 2-3měsíční odstup. APU Strix (Point) Halo neboli Sarlak, podstatně výkonnější řešení, se zřejmě objeví během zimy 2024/2025, snad ho AMD plánuje využít jako reakci na mobilní procesory Intel Arrow Lake / Lunar Lake.
Procesorová jádra - Zen 5
Strix Point bude vybaven 4 jádry Zen 5 se 4 MB L2 cache a 16 MB L3 cache + 8 jádry Zen 5c s 8 MB L2 cache a 8 MB L3 cache. V segmentu klasických APU se tak poprvé objeví konfigurace s více než 8 procesorovými jádry.
Sarlak počítá s 16 jádry Zen 5 (původně se objevovaly zprávy o možnosti 8× Zen 5 + 8× Zen 5c, ale již delší dobu se zmínky o výslovně Zen 5c neobjevují). To by indikovalo možnost použití čipletů pro desktop. Na druhou stranu Red Gaming Tech zmiňuje možnost, že by snad L3 cache (16 MB pro každou osmici jader, tj. 32 MB celkem) mohla být sdílená s GPU. Což zase použití standardních čipletů pro desktop nenapovídá, protože by GPU a jemu dostupná cache byly umístěné na různých kouscích křemíku propojených (z hlediska potřeb iGPU) ne zrovna superrychlým rozhraním.
(Red Gaming Tech)
Grafická jádra - RDNA 3.5
Obě APU budou vybavena integrovanou grafikou generace RDNA 3.5, což je RDNA 3 obohacená o některé prvky RDNA 4. Mluví se jednak o podpoře vyšších taktů (i když mám osobně dojem, že to stále nevypadá na takty, které byly původně pro RDNA 3 plánované - rád se ovšem budu mýlit), dále o nasazení skalární ALU z RDNA 4 s podporou FP32 instrukcí a nakonec o vylepšené geometrii. K prvkům, které zůstanou exkluzivní pro RDNA 4 (na RDNA 3.5 se neobjeví) má patřit vylepšený scheduling a neupřesněná vylepšení pro ray-tracing.
Strix Point bude vybaven grafikou o 16 CU (8 WGP), tedy 1024 (dual-issue) stream-procesory. Současný Phoenix / Hawk Point disponuje 768; půjde tedy o třetinový nárůst. K tomu se očekává nárůst taktovacích frekvencí, které by u modelů neomezených TDP měly překonat 3 GHz. Vezmeme-li v potaz údaj 14 TFLOPS, pak by nejrychlejší produkt na bázi Strix Point musel mít GPU taktované na až 3,3 GHz, nikoli méně. Oproti současnému Ryzen 7 8700G pro desktop (tj. z hlediska TDP neomezený Phoenix) by šlo zhruba o 50% posun teoretického výkonu integrované grafiky. V praxi (při možnostech chlazení, použitých pamětech ap.) očekávejme posun spíše třetinový.
Sarlak stojí právě na integrované grafice, která nabídne 40 CU (20 WGP), tj. 2560 stream-procesorů, což je 3,3× nad současným Phoenix / Hawk Point a 2,5× nad chystaným Strix Point. Aby paměťový systém zvládal, rozšíří se 256bit (tedy dvojnásobek kanálů). Protože v takové konfiguraci nebude možné počítat se socketovou verzí, bude nejspíš vždy vybaven pájenými rychlými LPDDR5X (či LPDDR5T?) pamětmi. Zacílí na segment notebooků, kde se dnes používají samostatné (byť úsporné) grafiky. Oproti kombinaci samostatného CPU + GPU nabídne nižší TDP, nižší nároky na rozměry chlazení a plochu PCB vůbec.
(Red Gaming Tech)
AI akcelerátor aneb NPU
Integrovaný AI akcelerátor poskočí jak po stránce konfigurace, tak po stránce architektury (XDNA→XDNA 2). Pro představu vyjdeme ze stávajících parametrů AI akcelerátoru v APU Phoenix a Hawk Point.
Ty jsou postavené na 16 jednotkách, pro které Xilinx používá označení AI Engine-ML Tile (tedy „lepší“ varianta než standardní AI Engine Tile).
(AMD)
Každá taková jednotka podporuje výpočty v přesnostech Int4, Int8, Int16, CINT16, BFLOAT16 a FP32, který umí emulovat pro zajištění kompatibility (ovšem s ne úplně špatným výkonem). APU Phoenix nabízí výkon akcelerátoru až 10 TOPS (v Int8, což při 16 dlaždicích znamená takt akcelerátoru 1,22 GHz), APU Hawk Point zrychlil na až 16 TOPS, což při pravděpodobně stejné hardwarové konfiguraci znamená takt akcelerátoru 1,95 GHz. S ohledem na takty akcelerátorů Xilinxu, které jsou na této architektuře postavené, byl takt 1,22 GHz extrémně nízký, takže to vypadá, že si AMD nastavením oněch 10 TOPS nechávala záměrný prostor na překvapení Intelu (s 16 TOPS Hawk Point), který právě s 10 TOPS počítal pro Meteor Lake.
Schéma jedné XDNA/NPU jednotky / tile (AMD)
Strix Point má podle CEO AMD Lisy Su přinejmenším ztrojnásobit výkon AI akcelerátoru oproti Ryzen 7040, tedy Phoenixu. Což znamená dosažení minimálně 30 TOPS. Zároveň máme z neoficiálních zdrojů informaci, že Strix Point bude vybaven akcelerátorem s 64 AI jednotkami, tedy čtyřnásobkem oproti Phoenixu. 4× více jednotek pro 3× vyšší výkon by znamenalo ještě nižší takty než u Phoenixu (konkrétně 0,92 GHz), takže se jeví jako pravděpodobnější, že půjde spíš o více než 30 TOPS, např. 35 TOPS (1,07 GHz) nebo ještě více (nereálné nejsou ani hodnoty ~45 TOPS). Možná podle segmentu, nebo naopak AMD chce ve všech segmentech nabídnout stejnou konfiguraci a takty proto musejí být nastaveny podle energeticky nejomezenějších produktů (řada U), tj. konzervativně.
Sarlak má nabídnout přinejmenším 50 TOPS, ovšem konkrétní konfiguraci neznáme. Jelikož jde o produkt určený pro notebooky s vyšším TDP, nebude nutné takty akcelerátoru příliš dusit a lze připustit možnost, že počet jednotek zůstane na 64, pouze takty budou vyšší. K dosažení 50 TOPS by při 64 jednotkách bylo potřeba 1,53 GHz, k dosažení 60 TOPS 1,83 GHz (tyto frekvence zvládá již akcelerátor s architekturou XDNA, takže by více než 64 jednotek nebylo nutných).
APU | rok | proc. | CPU | GPU | NPU | plocha |
---|---|---|---|---|---|---|
Llano | 2011 | 32nm | 4/4× K10,5 | 400 SP VLIW-5 | - | 226 mm² |
Trinity Richland | 2012 2013 | 32nm | 4/4× Piledriver | 384 SP VLIW-4 | - | 246 mm² |
Kaveri | 2014 | 28nm | 4/4× Steamroller | 512 SP GCN 2 | - | 245 mm² |
Carrizo Bristol Ridge | 2015 2016 | 28nm | 4/4× Excavator | 512 SP GCN 3 | - | 245 mm² |
Raven Ridge Picasso | 2017 2019 | 14nm 12nm | 4/8× Zen(+) | 704 SP Vega | - | 210 mm² |
Renoir Lucienne | 2020 2021 | 7nm | 8/16× Zen 2 | 512 SP Vega+ | - | 156 mm² |
Cezanne Barcelo | 2021 2022 | 7nm | 8/16× Zen 3 | 512 SP Vega+ | - | 180 mm² |
Rembrandt | 2022 | 6nm | 8/16× Zen 3+ | 768 RDNA 2 | - | 208 mm² |
Phoenix Hawk Point | 2023 2024 | 4nm | 8/16× Zen 4 | 768 RDNA 3 | 16× | 178 mm² |
Strix Point | 2024 | 4nm | 4/8× Zen 5 8/16× Zen 5c | 1024 RDNA 3.5 | 64× | 225 mm² |
Prozatím není slyšet prakticky nic o APU Strix Point 2, tedy menší variantě APU, která by mohla sloužit pro Ryzen 3 a levnější modely Ryzen 5. Nelze proto vyloučit možnost, že Strix Point zacílí pouze na vyšší segment (Ryzen 9, Ryzen 7, možná nějaký vyšší model Ryzen 5) a zbytek portfolia AMD ponechá v rukou Hawk Point / Hawk Point 2.
AMD Strix Point
- proces TSMC N4P
- plocha 225mm²
- 4× Zen 5 (L3 cache: 16 MB, L2 cache: 4 MB)
- 8× Zen 5c (L3 cache: 8 MB, L2 cache: 8 MB)
- GPU: 8 WGP RDNA3+ (1024 stream-procesorů RDNA 3.5)
- 64 AIE tile (~AI akcelerátor s 64 jednotkami XDNA 2)
- podporované paměti DDR5-6400 / LPDDR5X-8533
- TDP 28-45W
- druhá polovina léta 2024?
AMD Sarlak
- proces TSMC N4P? (čiplety?)
- 16× Zen 5 (L3 cache: 2× 16 MB)
- GPU: 20 WGP RDNA3+ (2560 stream-procesorů RDNA 3.5)
- 64 AIE tile (~AI akcelerátor s 64 jednotkami XDNA 2)?
- 256bit sběrnice
- podporované paměti LPDDR5X-8533
- TDP až 120 wattů
- zima 2024 / 2025?
Red Gaming Tech aj.