384bit sběrnice a 12 GB v konzoli? To je nový Xbox Scorpio
V souladu s očekáváním odhalil Microsoft dílčí parametry nové herní konzole Xbox Scorpio. Ta je do jisté míry chápána jako půlgenerační upgrade oproti Xbox One; jde ovšem o mnohem výraznější posun než v případě půlgenerace Playstation 4 -> Playstation 4 Pro. Většina informací byla zveřejněna zprostředkovaně přes redakci DigitalFoundry, která byla pozvána na prezentaci za zavřenými dveřmi. K tomu se ještě vrátíme.
Jádro nové konzole je vyráběno 16nm procesem TSMC. Překvapením může být procesorová konfigurace. Microsoft (přes lednové zvěsti redaktora Windows Central Jeze Cordena) ještě vsadil na architekturu Jaguar. Důvodem je patrně zpětná kompatibilita a snadná portovatelnost her Xbox One bez potřeby optimalizací pro odlišnou architekturu. Nelze ale říct, že by nedošlo ke změnám. V první řadě došlo k výraznému navýšení taktů, které dává starým jádrům o třetinu vyšší výkonnostní potenciál. Za druhé byla upravena implementace procesorových jader v rámci SoC, konkrétně komunikace procesorových jader s GPU. Významně byly sníženy latence a zlepšena koherence.
Zajímavější změny se odehrály na úrovni grafického jádra. Skok ze 768 stream-procesorů Xbox One na 2560 stream-procesorů Xbox Scorpio je obrovský. Posun ve výši 3,3násobku ale není jediným prvkem, který bude mít vliv na výsledný 3D výkon. Můžeme jej totiž vynásobit ještě koeficientem 1,4×, což odpovídá zvýšení taktovacích frekvencí z 853 na 1172 MHz. Takt GPU 1172 MHz je na poměry konzolí velmi vysoký a bezprecedentní; minulá generace, inovované modely i Playstation 4 PRO mají grafická jádra taktovaná kolem 800-900 MHz. Celkový aritmetický výkon Xbox Scorpio tedy stoupl 4,6×. Reálný patrně ještě výš, protože jde přinejmenším o dvě generace novější grafickou architekturu (i k tomu se ještě vrátíme).
Xbox Scorpio | Xbox One | PS4 Pro | PS4 | |
---|---|---|---|---|
typ jádra | x86 SoC | x86 SoC | x86 SoC | x86 SoC |
proces | 16nm | 28nm | 16nm | 28nm |
CPU | ||||
architektura | Jaguar | Jaguar | Jaguar | Jaguar |
takt | 2,3 GHz (1,3×) | 1,75 GHz | 2,1 GHz | 1,6 GHz |
jádra | 8 | 8 | 8 | 8 |
cache (L2) | 4 MB | 4 MB | 4 MB | 4 MB |
GPU | ||||
architektura | ? | GCN 2 | GCN 3+ | GCN 2 |
takt | 1172 MHz (1,4×) | 853 MHz | 911 MHz | 800 MHz |
stream-procesory | 2560 (3,3×) | 768 | 2304 | 1152 |
výkon (FP32) | 6,0 TFLOPS (4,6×) | 1,3 TFLOPS | 4,2 TFLOPS | 1,8 TFLOPS |
ESRAM | - | 32 MB | - | - |
RAM | ||||
typ | GDDR5 | DDR3 | GDDR5 | GDDR5 |
kapacita | 12 GB | 8 GB | 8 GB | 8 GB |
z toho dostupno grafice | 8 GB | 5 GB (+32MB SRAM) | 5 GB | 5 GB |
takt (ef.) | 6,8 GHz (3,2×) | 2,1 GHz | 6,8 GHz | 5,5 GHz |
sběrnice | 384bit (1,5×) | 256bit | 256bit | 256bit |
datová propustnost | 326,4 GB/s (4,8× / 1,2×) | 68 GB/s (+209 GB/s ESRAM) | 218 GB/s | 176 GB/s |
ostatní | ||||
vydání | Q4 2017 | Q4 2013 | Q4 2016 | Q4 2013 |
Další - ve světě konzolí unikátní - prvek je 384bit sběrnice kombinovaná s pamětmi GDDR5. Konfigurace, na kterou jsme ve světě desktopových grafických karet zvyklí jen v segmentu high-endu, do světa konzolí přináší paměťovou propustnost 326,4 GB/s. I když je sdílena pro procesor i grafiku, lze říct, že procesorová jádra z ní při herní zátěži neukrojí více než těch 26,4 GB, takže 300 GB/s (spíš více) zbyde pro grafiku. Takto vysoká datová propustnost se jeví jako trochu nadsazená, zkrátka vyšší, než by bylo potřeba, takže si troufám říct, že jde spíše o vedlejší efekt snahy osazení 12GB paměti (kterou na 256bit sběrnici efektivně nepřipojíte).
Microsoft novinářům předvedl ukázku z portované verze Forza. Portace byla hotová během dvou dnů, takže nešlo o nějaké dlouhodobé optimalizace enginu pro nový hardware, přesto v nativním 4k běžela na 60 FPS při vytížení GPU mezi 55-70 %. Výkon nového hardwaru umožňuje použít mj. kvalitnější zpracování textur.
Závěrem se krátce vrátím k architektuře GPU. Přestože některé zdroje hovoří explicitně o použití Polaris, vznikla tato zvěst jako spekulace Richarda Leadbettera z DigitalFoundry, odkud ji ostatní weby převzaly. Nejde o informaci pocházející od Microsoftu, ten konkrétní typ architektury nezmiňoval. Dosavadní informace poukazovaly na to, že spíš než Polaris bude jádro nového Xboxu blíže architektuře Vega. Důvodů je hned několik:
- Xbox Scorpio bude v době vydání o rok novější než Playstation 4 PRO, jehož GPU už bylo o některé prvky architektury Vega obohaceno
- při konfiguraci vyšší než má GPU Polaris 10 by spotřeba samotného integrovaného grafického jádra, za použití generické architektury Polaris musela dosahovat 160-180 wattů
- takt GPU je výrazně vyšší než u GPU Playstation PRO
- Leadbetter sám připouští, že podle Microsoftu došlo v architektuře grafického jádra ke zhruba šedesáti úpravám, což samo o sobě indikuje významný architektonický posun
Je jasné, že grafické jádro Xboxu Scorpio nebude obsahovat ty architektonické prvky architektury Vega, které konzole nemůže využít. Kupříkladu tzv. high-bandwidth cache, podpora virtualizace nebo řadič HBM pamětí. Bylo by ovšem naivní předpokládat, že bude od architektury Vega (GCN 5) vzdálenější než od architektury Polaris (GCN 4), když již rok před Scorpio disponoval několika prvky Vegy Playstation 4 Pro. Jedním z těchto prvků je podpora přesnosti FP16 ve dvojnásobném výkonu oproti FP32, jiným pak zrychlené zpracování geometrie a dalším přepracovaná distribuce úloh.
Pokud jde o Scorpio, zmiňuje Microsoft mimo jiné hlubší integraci pro podporu DirectX 12, která by právě s řízením GPU a distribucí úloh mohla souviset. Dalšími prvky Vegy, které jsem nezmínil ani jako pro konzole nepotřebné, ale ani jako využité u Playstation 4 Pro, jsou například implementace ROP jakožto klientů grafické cache, nový rasterizér, využití nové sběrnice nebo tzv. primitive shaders - krom jiných technologií, které ještě nebyly odhalené. Nekonkrétnost údajů Microsoftu v tomto směru může souviset právě s faktem, že vydání architektury Vega dojde teprve příští měsíc a smlouvy mezi Microsoftem a AMD jistě zahrnují i oboustranná NDA.
Bez ohledu na další detaily grafické architektury je zřejmé, že Xbox Scorpio přinese velmi významný výkonnostní skok. 4,6× vyšší hrubý grafický výkon v kombinaci s 4,8× vyšší datovou propustností sběrnice a o 2-3 generace novější grafickou architekturou by měly řadě her zajistit dostatečný výkon pro rendering ve 4k rozlišení. Na druhou stranu je otázkou, zda bude mít ve všech situacích smysl dávat prioritu renderingu v nativním 4k rozlišení před šachovnicovým renderingem do 4k, který umožňuje téměř polovinu výkonu ušetřit a poskytnout třeba na kvalitnější textury a modely. To už ale bude záviset na konrétních situacích. V té současné chce Microsoft ukázat, že má k dispozici plus mínus o polovinu vyšší výkon, datovou propustnost i kapacitu paměti než Sony s Playstation 4 Pro.