Diit.cz - Novinky a informace o hardware, software a internetu

Desktopový Renoir má nečekaně nízké latence přístupu k pamětem

V diskuzích se opakovaně objevoval dotaz, zda nebude desktopové APU Renoir limitovat 4× menší L3 oproti stávajícím procesorům Ryzen 3000. Důvody negativní odpovědi nyní můžeme podložit výsledkem…
nepřehlédněte

Když v roce 2017 vydala AMD první generaci Ryzenů (1000), byl prostor pro zlepšení především po stránce latencí při přístupu k pamětem (částečně též k L3 cache a L2 cache). U top modelu Ryzen 7 1800X dosahovala latence s nejlevnějšími ~DDR4-2133 pamětmi přes 100 ns, s trochu slušnými DDR4-2400 kolem 95 ns a při použití lepší DDR4-2667 kolem 85 ns. U druhé generace, Ryzen 7 2700X, AMD na latencích zapracovala a při použití DDR4-2667 se z ~85 ns dostala na ~75 ns, což bylo v některých typech zátěže docela znát. Tuto hodnotu už nebylo možné příliš kritizovat, neboť Intel na tehdejších procesorech s podobným počtem jader (segment HEDT) nenabízel nižší.

S nástupem čipletové architektury AMD dále řadič vylepšila, ovšem tato zlepšení zčásti kompenzovala mírné zvýšení latencí dané rozhraním mezi procesorovým a centrálním čipletem. Ryzen 7 3800X (zůstaneme-li pro přehlednost u osmijádrových modelů) dosahoval podle pamětí v rozmezí 70-80 ns. Při použití kvalitnějších / rychlejších pamětí, které nový řadič v centrálním čipletu podporoval, se bylo možné dostat zhruba do rozmezí 65-70 ns.

Zmíněná kompenzace latencí čipletového návrhu spočívala mj. i v navýšení kapacity L3 cache na až 32 MB pro osmijádrovou konfiguraci. Když se potom objevily první zprávy, že 7nm APU Renoir bude vybaveno 8MB, tedy 4× nižší kapacitou cache, objevovaly se obavy, zda to nebude mít příliš výrazný dopad na výkon procesoru. Ty se částečně rozptýlily prvními testy mobilní verze a částečně i argumentem, že kapacita L3 cache u čipletových Ryzenů v průměru spíše kompenzuje latence návrhu než aby generovala nějaký výkon. Jistě se najde zátěž, která bude lépe sedět procesoru s 32MB L3 cache a vyššími latencemi, ale stejně tak se najde zátěž, která bude lépe sedět procesoru s 8MB L3 cache s nižšími latencemi. Otázka byla, o kolik nižší vlastně budou?

Odpověď nám dává první test vzorku 35W modelu Ryzen 7 4700GE. Ten sice nemá nastavené finální taktovací frekvence, ale to nevadí. Podstatnější je, že nám odpovídá na výše položenou otázku: Dosahuje latencí 47,6 ns při použití DDR4-4333, přičemž čipletový Ryzen se při takto rychlých pamětech dostane zhruba na 76 ns.

47,6 ns je výborný výsledek (latence 2× nižší než u první generace Ryzenů) a není tak divu, že se při takových hodnotách nechtělo AMD zvětšovat (zdražovat) jádro vyšší kapacitou L3 cache.


Pokud jde o další vývoj, víme, že AMD se třetí generací Zenu plánuje optimalizace po stránce L3 cache. V současnosti jsou na osmijádrovou konfiguraci přítomné dva oddíly L3 cache, jeden pro každá čtyři jádra. Zen 3 tyto oddíly sloučí, což by teoreticky mělo přinést několik zlepšení. Jednak vyšší imunitu na blbost scheduleru OS Windows, který má tendenci přehazovat běh jednovláknové úlohy mezi různými fyzickými jádry, v důsledku čehož je nutné přesouvat obsah L3 cache vždy k tomu jádru, na které Windows zátěž přesunou. S jednotnou L3 pro všechna jádra nebudou tyto přesuny tak bolestivé (co do ztrát výkonu). Druhá výhoda by měla spočívat s efektivnější využitelností jednotné velké cache. Pokud například jedna aplikace běží na dvou jádrech, ale pro efektivní běh vyžaduje stejnou kapacitu L3 cache jako druhá, která běží paralelně s ní na osmi jádrech, bude pro ně konfigurace Zen 3 vhodnější než u Zen 2. Třetí výhoda by se měla týkat her. Situace, kdy jádro potřebuje přistupovat k obsahu L3 cache příslušející jinému jádru je jedním z posledních zásadnějších důvodů, které Intelu ponechávají několikaprocentní výkonnostní náskok ve hrách (druhým je o něco vyšší boost pro jedno jádro nebo nízký počet jader u her, které více jader neumějí efektivně využít).

Tagy: 
Zdroje: 

Diskuse ke článku Desktopový Renoir má nečekaně nízké latence přístupu k pamětem

Čtvrtek, 2 Červenec 2020 - 01:27 | kolemjdouci | v CPU-Z se zobrazuje 2x 4MB, a strukturálně to...
Středa, 1 Červenec 2020 - 19:13 | Hrdina | Taková politická odpověď ))) jak asi... určitě....
Středa, 1 Červenec 2020 - 19:11 | Hrdina | Kdybys napsal u dobrýho šluku ufáknout, tak...
Středa, 1 Červenec 2020 - 18:27 | Tom Buri | '' ale prrr.. i prvni ryzen zvladal...
Středa, 1 Červenec 2020 - 16:51 | no-X | Jednotnou ohlásili pro Zen 3, takže předpokládám...
Středa, 1 Červenec 2020 - 15:23 | WIFT | A tak i při dobrým šuku se dá luxusně ufláknout :...
Středa, 1 Červenec 2020 - 14:55 | kolemjdouci | ...parametry těch pamětí jsou tak brutální, že se...
Středa, 1 Červenec 2020 - 14:46 | Waffer47 | Ja bych se rad autora zeptal jestli je ta 8MB L3...
Středa, 1 Červenec 2020 - 13:03 | hajčus | Jen bacha na bratříčky Větříčky... :)
Středa, 1 Červenec 2020 - 12:49 | Hrdina | Vzrušuje mě otec Slunce, když se dotýkám matky...

Zobrazit diskusi