Microsoft zveřejnil testy Milan-X, vliv V-cache je vyšší než rozdíl Zen 2-Zen 3
Epyc Milan-X se od Epyc Milan liší navrstvením 64MB L3 cache (navíc) na každý čiplet. Tím se kapacita L3 cache 64jádrového procesoru zvyšuje z 256 MB na 768 MB, tedy na trojnásobek. Podrobněji v tabulce:
Milan-X / Milan | L3 | L2 | L1 | celkem |
---|---|---|---|---|
na socket | 768 / 256 MB | 32 MB | 4 MB | 804 / 292 MB |
na čiplet | 96 / 32 MB | 4 MB | 0,5 MB | 100,5 / 36,5 MB |
na jádro | 12 / 4 MB | 0,5 MB | 0,06 MB | 12,6 / 4,6 MB |
Podle již dříve zveřejněných údajů AMD se u desktopových procesorů cache navíc může projevit až 15% nárůstem herního výkonu. Jak je tomu v serverech, kde se rovněž objevují typy, zátěže, které mohou z velké cache profitovat, zveřejnil Microsoft, který na Milan-X postavil nové servery Azure HBv3. První čísla zmínil již vice-prezident Microsoftu pro cloud, Jason Zander (úvodní snímek), nyní jsou k dispozici kompletní výsledky měření, ze kterých tyto údaje pocházely:
Jednotlivé typy zátěže jsou uvedeny v nadpisech grafů. Sloupce srovnávají Milan-X (ve všech grafech modře) se standardním Milan (vždy žlutě) a případně i s Rome (tj. Zen 2, fialově) a někdy též s Xeony se 14nm jádry Skylake (zeleně). V prvním grafu, který dále srovnává výkonnostní nárůst v závislosti na počtu uzlů (1-64) dosahuje Milan-X v průměru o 16,7 % výkonu navíc.
OpenFOAM v. 1912 / Motorbike 28m je příkladem extrémní situace, kdy V-cache přidává až(!) 64 % výkonu. Nárůsty jsou podstatně vyšší než jaké přinesla architektura Zen 3 oproti Zen 2.
V Siemens Simcenter Star-CCM+ přináší V-cache stejný (respektive mírně vyšší) nárůst výkonu, než jakého dosahoval Zen 3 (Milan) oproti Zen 2 (Rome). Milan oproti předchůdci v této zátěži přinesl v průměru 12,1 % výkonu navíc, Milan-X přináší 12,4 % výkonu navíc.
Následují čtyři grafy vycházející z měření v různých zátěžích v Ansys Fluent 2021 R1. V prvním z nich (výše) opět V-cache přináší trochu více výkonu než přechod z Zen 2 a na Zen 3.
V druhém jde dokonce o 38-49% nárůst.
V Aircraft_14m přibylo v průměru 25,8 % výkonu.
A v f1_racecar_140m dává V-cache 7-78 % výkonu navíc. V průměru o 27 % výkonu navíc.
Příkladem situace, kdy se V-cache nijak podstatně neprojevuje, je NAMD 2.15. Dochází ke 2-3 % nárůstu, v průměru 2,6 %. Je však potřeba upozornit, že kdosi v Microsoftu zapomněl u tohoto grafu správně nastavit rozsahy. Jako jediný ze zveřejněných jednak nezačíná v nule a zároveň jako jediný nechává horní dvě třetiny plochy nevyužité.
Cache sama o sobě výkon negeneruje, pouze snižuje dva druhy limitací. Jednak limitaci danou nedostatkem paměťové propustnosti a jednak limitaci danou latencemi. V případě procesorů mají hlavní vliv latence (propustnost je klíčová v grafických jádrech). Tabulka ukazuje, že V-cache (Milan-X) podstatně snižuje latence (samozřejmě v typech zátěže, kde se data nevejdou do menší cache klasického Milan), z čehož pramení výkon navíc.
V posledním grafu porovnává Microsoft výkon systému s náklady na něj vynaloženými.
Závěrem je potřeba upozornit, že výkon naměřený na Microsoft Azure HBv3 nelze extrapolovat a/nebo vztahovat na chování Zen 3 s V-cache v desktopu. Desktopové aplikace obvykle pracují s daleko menšími objemy dat, které se častěji vejdou do standardní cache, takže průměrné nárůsty výkonu budou podstatně menší. Mezi profitující aplikace budou patřit hry s až 15 % výkonu navíc.