Diit.cz - Novinky a informace o hardware, software a internetu

Megatest různých konfigurací RAM s AMD EPYC 7402 CPU v režii Supermicro

Osadit osm paměťových kanálů? Nebo jen jeden? Dual rank, single rank či quad rank RAM? Samé otázky...

Kapitoly článků

2.  7-Zip - komprese a dekomprese, AIDA64 propustnost RAM, raddi.net benchmark
4.  Závěrem

7-Zip 21.07 64-bit

7-Zip jakožto nejlepší open source archivační program pro Windows asi netřeba detailně představovat. Obsahuje zabudovaný benchmark, který používám pro testování výkonu v kompresních a dekompresních operacích. Velikost slovníku nastavuji na 32MB a 128MB a používám všechna dostupná CPU vlákna. 

Komprese je značně náročnější činnost, než dekomprese a tak je graf s výkonem dekomprese téměř možné ignorovat. Mimo procesorová jádra má na kompresi vliv velikost i množství paměti. V případě s 32MB slovníkem se pro zabalení použije téměř 39GB RAM, což rozhodí jen konfigurace co mají méně paměti. V grafu můžeme vidět, že nejlepší výkon poskytují quad-rank Samsungy a to jak v 2DPC tak v 1DPC konfiguraci. Dál můžeme vidět, že single-rank 8GB paměti mají nejhorší výkon, zajímavý je hlavně propad při použití čtyř modulů, což je dáno tím, že 4x8GB  RAM je méně, než potřebných 39GB pro test + nějakou omáčku, kterou si k tomu bere Windowsí Server. V konfiguraci s 8GB RAM nebylo možné test spustit.

graph-6
graph-7
graph-8

Pro mně je však zajímavější test s větším 128MB slovníkem, stejně testuji i notebooky a desktopy, sežere to více RAM, trvá to celé déle a je to prostě náročnějí test. A ano, pokud můžu kompresím vždy s LZMA2 Ultra, co největším slovníkem i když je to do jisté míry placebo. V tomto testu nebylo možné testovat konfigurace s méně jak 64GB RAM, jelikož 7-Zip si bral 119 GB RAM.

Zde se v rámci chyby měření potulují na prvním místě 2DPC konfigurace 64GB a 128GB modulů, což je lehce překvapující, čekal bych, že 1DPC konfigurace poskytnou lehce lepší výkon, ale není tomu tak. Je také velmi zajímavé, že čtyři 128GB moduly v čtyřkanálovém zapojení podávají relativně podobný výkon jako v osmikanálovém zapojení. Jenže některé vyšší konfigurace mají hodně modulů a řekl bych, že se velmi akčně nepoužijí všechny, testuji vlastně jen něco málo přes 120GB RAM. Tedy poznámka pro příště je taková, že musím pustit více testů najednou a přitlačit na velikosti slovníku.

graph-9
graph-10

Čas existuje a lze ho měřit. Pro představu, jak dlouho takový test v 7-Zipu trvá a kolik času zebere testovací komprese a dekomprese dat, přidávám grafík, kde můžeme vidět jak dlouho test běžel. Rozdíl mezi osmi kanály a jedním kanálem je poměrně masivní.

graph-11
graph-12

 

AIDA 64 Extreme Edition Beta

Pro testování jsem také použil tradiční AIDU64 v nejnovější betě. AIDA64 víceméně posloužila jako takový rychlo testík pro představu jaká může být propustnost RAM. Nicméně řekl bych, že test paměti není velmi dobrý s více RAM a kanály, jelikož propustnost RAM v osmikanálovém zapojení by měla teoreticky dosáhnout až na 170GB/s nebo více(AMD uvádí 204,8 GB/s).

Zajímavý je hlavně test Photovorxx, který benefituje právě z propustnosti RAM a méně s množstvím procesorových jader.

graph-13
graph-14
graph-15
graph-16
graph-17

 

raddi.net benchmark

Ze zvědavosti jsem zkusil i raddi.net benchmark, se kterým přišel několik měsíců nazpět jeden ze čtenářů.

A co benchmark dělá? Cituji komentátora:

Je to benchmark PoW algoritmu Cuckoo Cycle s maticovou optimalizací. Zjednodušeným SipHashem generuje pole 2^N 32-bit čísel (tzn. složitost 29 zabere 2 GB) a v nich hledá uzavřený cyklický graf: Cyklus čísel, které jsou index/ukazatele na další číslo, tak aby nakonec to poslední ukazovalo zpátky na to první. Ale ne přímo, každé číslo se musí nejprve protočit tím SipHash.
Hledání se paralelizuje až do 64 vláken, komplexity 28 a 29 by šly i na 128, ale to bych musel psát vlastní threapool, který bude na Windows umět opustit groupu. Možná v budoucnu.
Efekt tohoto čarování by měl být vysoce neprediktovatelný přístup do paměti.
Smyslem je do max. možné míry smazat výkonové rozdíly mezi různými PC.
Bohužel mám obavy, že jakmile přijdou CPU, kde se celý dataset vejde do L3, ty nízké složitosti shoří jak papír.

Nejrelevantnější je tedy komlexita 29, ale uvádím pro jistotu i všechny ostatní. Všechny výsledky jsou ve vteřinách.

graph-18
graph-19
graph-20

Test krátce využije všechna dostupná procesorová jádra, přičemž časový rozdíl mezi osmikanálovým zapojením pamětí a jednokanálem je opravdu velký.

graph-21
Kapitoly článků
2.  7-Zip - komprese a dekomprese, AIDA64 propustnost RAM, raddi.net benchmark
4.  Závěrem

Karel "Karáš Svorka" Svoboda (Google+)

Pesíci dělají chro. Je potřeba vysumýšovat chrochták.

VGA Legacy MKIII

více článků, blogů a informací o autorovi

Diskuse ke článku Megatest různých konfigurací RAM s AMD EPYC 7402 CPU v režii Supermicro

Pátek, 17 Červen 2022 - 17:14 | Karáš Svorka | Děkuji za tip, podívám se na to až najdu nějaký...
Pátek, 17 Červen 2022 - 10:18 | Logik KarelVomáčka | Mám návrh na reálný aplikační test, který by měl...
Čtvrtek, 16 Červen 2022 - 15:48 | Karáš Svorka | On je možná problém i v tom, že se té paměti...
Čtvrtek, 16 Červen 2022 - 07:44 | RADDI.net | Parádní test. Těší mě vidět svůj benchmark. Ale...
Úterý, 14 Červen 2022 - 15:06 | Karáš Svorka | Ta sada testů je celkem malá, takže to nemá...
Úterý, 14 Červen 2022 - 10:10 | Karáš Svorka | Ono když se podíváte na ty některé phoronix testy...
Úterý, 14 Červen 2022 - 10:09 | Karáš Svorka | Jo Milani neexistují v těhle levnějších a nižších...
Úterý, 14 Červen 2022 - 10:06 | Karáš Svorka | Ono hodně těch testů právě nevyužije ani tolik...
Úterý, 14 Červen 2022 - 10:06 | Karáš Svorka | To teoreticky půjde, ale je otázka, jak se bude...
Úterý, 14 Červen 2022 - 08:01 | Kert | Mě přijde celková propustnost hrozně nízká oproti...

Zobrazit diskusi