Proč je Raven Ridge ve Wolfenstein II 2× rychlejší než GeForce GT 1030?
Integrovaná grafika Ryzen 5 2400G dosahuje v průměru výkonu blízkého až totožného (to podle recenze, kterou si vyberete), jaký nabízí samostatná GeForce GT 1030. Rozdíly mezi recenzemi mohou být dané výběrem her, výběrem konkrétního modelu GeForce (některé mohou být přetaktované nebo díky lepšímu chladiči držet vyšší frekvence; Anandtech se pak chlubí údajným použitím jinak nedostupného 4GB modelu) nebo typem operačních pamětí, které byly osazené v sestavě s Raven Ridge. Například nízké latence mají podstatnější vliv než takty výrazně přesahující efektivní 3 GHz.
Poměrně blízké postavení integrované Vegy a samostatné GeForce ale narušily výsledky ve hře Wolfenstein II: The New Colossus, kde Vega výkonnějšího APU dosahuje výkonu více méně dvojnásobného oproti GeForce GT 1030:
Techspot
Na výsledku není nečekaný pouze samotný výkonnostní odstup, ale také poměrně vysoká stabilita FPS, která rovněž není pro integrované řešení úplně typická.
Co za tímto výkonnostním rozporem může stát? Objevil se názor, že API Vulkan. Tím to ale nebude, využívá jej třeba i Doom, kde ale k podobné anomálii nedochází:
TechReport
Dále se objevil názor, že za výsledkem mohou stát technologie Vegy pro snížení nároků na paměťovou sběrnici. Jenže podobnými technologiemi je vybaveno i jádro generace Pascal, kterým je osazena GeForce GT 1030 a které má hrubou paměťovou propustnost vyšší než integrovaná Vega. Navíc ji má ještě sama pro sebe, kdežto Vega se dělí s procesorovým jádrem. Technologickou výbavou Vegy lze vysvětlit stabilnější FPS vůči APU Carrizo (v horních grafech jako A12-9800), ale nikoli náskok oproti GeForce GT 1030. Podobný náskok proti ní (byť s méně stabilními FPS) totiž nabízí i zmíněné Carrizo.
Osobně se domnívám, že pro vysvětlení situace ani není třeba zabrušovat do architektonických tajů jednotlivých architektur. Jak je ostatně vidět z výše uvedených pokusů o vysvětlení, nevybrušuje se z toho právě snadno. Postačí jednoduchá matematika.
PCIe 3.0 | PCIe 2.0 | PCIe 1.0 | |
---|---|---|---|
1× | 1 GB/s | 0,5 GB/s | 0,25 GB/s |
4× | 4 GB/s | 2 GB/s | 1 GB/s |
8× | 8 GB/s | 4 GB/s | 2 GB/s |
16× | 16 GB/s | 8 GB/s | 4 GB/s |
Wolfenstein II je poměrně náročný na kapacitu paměti. Zdá se proto pravděpodobné, že 2GB osazené na GeForce GT 1030 mu zkrátka nestačí a dochází k permanentnímu tahání dat z RAM po PCIe sběrnici. V případě výše uvedeného testu Techstpotu, kde bylo testováno s Pentiem G4560, je maximální teoretická datová propustnost PCIe sběrnice ve směru systém -> GPU 16 GB/s. Je jedno, jak rychlé operační paměti jsou osazené, protože s libovolnými DDR4 bude rychlost přenosu omezena na straně PCIe na oněch 16 GB/s. V praxi je ale nižší, protože GeForce GT 1030 - ač slotem PCIe ×16, má zapojené pouze čtyři linky, tzn. PCIe ×4 s datovou propustnosti 4 GB/s v jednom směru.
1 kanál (64bit) | 2 kanály (128bit) | 4 kanály (256bit) | |
---|---|---|---|
DDR4-2666 | 21 GB/s | 43 GB/s | 85 GB/s |
DDR4-2933 | 23 GB/s | 47 GB/s | 94 GB/s |
DDR4-3200 | 26 GB/s | 51 GB/s | 102 GB/s |
DDR4-3600 | 29 GB/s | 58 GB/s | 115 GB/s |
Naproti tomu grafika APU Raven Ridge je připojena k paměťovému řadiči přímo přes sběrnici Infinity Fabric, kde k podobnému limitu nedochází. Pokud jsou v sestavě osazeny maximální doporučené DDR4-2933 ve standardním dvoukanálovém osazení, je propustnost ve směru systém -> GPU 47 GB/s; téměř trojnásobná oproti samostatné grafice.
Tohle může být signálem i do budoucna pro majitele Raven Ridge - 2GB grafickou kartu (přinejmenším se standardním řadičem) nelze chápat jako upgrade. Pokud ji dojde paměť, což bude s nadcházejícími hrami čím dál častější jev - bude její datová propustnost několikanásobně nižší než datová propustnost integrované grafiky, konkrétně 4-16 GB/s podle šířky sběrnice karty a systému.