Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Zen 3 oproti Zen (1) posunul herní a aplikační výkon o 70-90 %

Skoda, ze hodnotili jen vykon Zen1 az 3. Mnohem zajimavejsi by bylo srovnani Skylake az Skylake++++++ a nasledne srovnani napric mezi Zen a Skylake.

Vime pritom, ze Zen1 dosahoval vykonu Haswellu, teda hluboko pod Skylake a Zen3 predci Skylake++++++ (Comet Lake), teda je zrejme, ze AMD sla v prubehu let nahoru mnohem prudci krivkou, jen by bylo zajimave videt to v case, jak moc sli kupredu oproti Intelu.

Jinak teda i na vyssim rozliseni uz dnes vidime, ze 4 jadra na hry nestaci, takovy 3300X uz grafiku vytizit v Cyberpunku nedokaze, uz dneska ve hrach, kdo nema aspon 6 jadro, tak mu nova vykonejsi grafika prestane prinaset uzitek.

+1
+8
-1
Je komentář přínosný?

Ja bych takovou postupku na Intelu taky uvital - ale zacal bych o neco drive nez na Haswellu - ten je u me nejcastejsi a vyckavam s upgradem, protoze proste staci - a je jednodussi pridat levnej stroj, nez draze menit za vykonnejsi.

Otazka je, co zvolit za modely ktere budou vsude - zrejme 4C/4T, a pak frekvencne to dava porad hodne velke rozpeti (idealne tedy vzit min/max variantu a v grafu to mit jako rozsah, namisto 1 bodu).

+1
+3
-1
Je komentář přínosný?

Nevim, jestli ti rozumim, ale pokud neresis jen kancelar (office, internet), tak 4jadro uz si myslim, ze bys brat nemel, uz to 4C/8T zacne byt pro spoustu aplikaci slabe. Proste kdo ma ted ctyrjadro, jeste s nim vydrzi rok dva, ale do novych pracovnich stanic a hernich stroju uz ne. Za me teda momentalne idealni mainstream, ktery cloveka nezboura cenou, je 6C/12T. AMD Ryzen 5 2600 nebo hodne zajimavy Intel Core i5-10400F jsou myslim v prijemne cenovce. Skoda ze se zdrazil Ryzen 3600 misto, aby se po nastupu nove generace zlevnil.

+1
+2
-1
Je komentář přínosný?

me stacilo to srovnani staryho xeonu na buildu win z 2015 a 2020 :D 1/4 vykonu sla dolu za ten cas ... takze skylake a podobny historie bych uz radeji nechal spat

+1
+2
-1
Je komentář přínosný?

nastesti v linuxu muzem delat mitigations=off, ve win to nejde?

+1
0
-1
Je komentář přínosný?

vsechny ne, jen cast jde pomoci nejake utility vypnout, kdyz je deaktivovali bylo to porad cca o pulku toho zpomaleni loudavejsi

+1
0
-1
Je komentář přínosný?

AMD nic nezdražilo...

+1
0
-1
Je komentář přínosný?

To ani nerikam, ale pro me je dulezity, kolik to stoji v obchode a faktem je, ze je to drazsi nez to bylo. Kdo za to muze je jina otazka. AMD situaci nacenenim nove rady 5000 prilis nepomohla.

+1
0
-1
Je komentář přínosný?

Proč myslíš? Vzhledem k tomu jak jsou 5xxx pernamentně vyprodané by pro koncáka stály stejně, akorát by z toho mělo míň AMD a víc obchodníci. Současné ceny jsou prostě důsledkem poměru nabídka/poptávka. Ono se to po novém roce uklidní.

+1
0
-1
Je komentář přínosný?

10xxx uz nedam do Z370 desky, kde ted idli G4900, a kdyz srovnam napr. 9900 vs 10900, tak tam je 4% narust, coz vymenu desky/platformy opravdu neomluvi. Premyslim ze se tam poridi 9900K, jak to klesne po vanocich na cca 6000.- z druhe ruky.

+1
0
-1
Je komentář přínosný?

ak chceme porovnat jednotlive generacie, tak to musi byt nastavene na rovnaku frekvenciu! r1800x 3600MHz vs r5800x 3800MHz je neporovnatelne, navyse maju uplne ine turbo frekvencie a to 3600/3800 neznamena vobec nic.

+1
-20
-1
Je komentář přínosný?

faaakt? sem nikde necet, ze by porovnavali ipc.. porovnavaj nejvykonnejsi osmijadra ctyr generaci.. kdyz si nekdo koupi osmijadro zen3, tak asi ne kvuli tomu, aby bezelo na taktech tri roky staryho zenu..

+1
+19
-1
Je komentář přínosný?

To je pěkná pitomost. Nesrovnává se architektura. Tady se srovnává, o kolik se posunul celkový výkon, který se z toho dá vymáčknout.

+1
+13
-1
Je komentář přínosný?

tak potom treba zmenit nadpis, lebo je zavadzajuci

+1
-11
-1
Je komentář přínosný?

ani v nadpisu neni nic o ipc..

+1
+7
-1
Je komentář přínosný?

vždyť přece hrubě: výkon = ipc * frekvence

+1
+1
-1
Je komentář přínosný?

Perex begin:
podľa mňa

výpočtový výkon = kvalitaPredpovede * ipc * frekvence

a tá predikcia je výrazne iná medzi Zen/Zen+ a Zen2.

Ja viem 98-99% úspešnosť v Zen a o 30% menšia neúpešnosť v Zen2 (úspešnosť 99,00% vs 99,30% ) sa nezá zásadnou ale je zásadnou pre výkon

Vypnutie prediktorov patchom SESES zníži výkon CPU o 93%. A to sa týka len 3 z minimálne 7 predikorov v CPU Teda hlavná časť výkonu je v prediktoroch. Napr. v prediktoroch pre radič RAM.
:Perex End

The Zen/Zen+ microarchitecture uses a hashed perceptron predictor for this purpose which is supplemented in Zen 2 by a TAGE predictor.

According to AMD it exhibits a 30% lower misprediction rate than its perceptron counterpart in the Zen/Zen+ microarchitecture.
https://en.wikichip.org/wiki/amd/microarchitectures/zen_2

Google Engineer Shows "SESES" For Mitigating LVI + Side-Channel Attacks - Code Runs ~7% Original Speed
21 March 2020
https://www.phoronix.com/scan.php?page=news_item&px=LLVM-SESES-Mitigatin...

+1
0
-1
Je komentář přínosný?

kvalitaPredpovede už je zahrnuta v ipc

+1
+1
-1
Je komentář přínosný?

je zahrnutá v praktickom IPC, ale nie je zahrnutá v teoretickom IPC.

A teoretické IPC sa nedá zdvihnúť. Praktické IPC sa dá zdvihnúť prekompliáciou SW, úprvou mikródu/AGESA alebo knižníc či jadro OS.

Otázkou je koľko je pokuta za nesprávnu predpoveď (missprediction penalty)

Pri 32 stupňovej pipeline a nax 4 inštukcie za cyklus je

128 zbytočne vykonaných a 32 cyklov k návratu + nejaké cykly čistenia,

teda to bude viac ako 160x kód pomalší

pri 98%
98% trvá 1x
2% trvajú 160x

0,98+160*0,02=4,18 a teda využívate CPU na 1/4.18= 24% možností a teda praktické IPC je 24% z teoretického

pre 1% neúpešných predpovedí je praktické IPC 39% teoretického

pre 0,1% neúpešných predpovedí je praktické IPC 88% teoretického

A to sa bavíme o jedinom prediktore.
A preto je dôležité mať lepší prediktor, alebo kód "predžutý", tak aby vyhovoval prediktoru daného CPT,
lebo v teoretickom IPC má rezervu aj Zen2 a Zen3 ju ešte zvýšil..

Nastavenie prediktora a systému jeho učenia sa(prispôosobovania sa použitému SW) je u AMD v AGESA..

A preto tu máme

Nové BIOSy zvyšují herní výkon Ryzenu, zpřístupňují rychlé paměti
25. 5. 2017
Pokud např. konfigurace umožnila dosažení nejvýše 2933 MHz, pak zpřístupnění 3200 MHz přináší v Htimanovi v průměru kolem 6 % výkonu, zpřístupnění 3200 MHz LL (low-latency) 20 % výkonu navíc a zvládají-li to paměti, pak nastavení 3466 MHz LL přinese přes 22 % výkonu navíc.
https://diit.cz/clanek/nove-biosy-zvysuji-vykon-ryzenu

BIOS AGESA 1002a zvýšil herní výkon Ryzen 5 2400G / Ryzen 3 2200G
26. 4. 2018
https://diit.cz/clanek/bios-agesa-1002a-zvysil-herni-vykon-raven-ridge

+1
+2
-1
Je komentář přínosný?

Kontrolní otázka: jaký procesor má 32 stupňovou pipeline? Pokud vím, tak nejdelší pipeline měl Prescott z řady Pentium 4 s 31 stupňovou pipeline. Moderní CPU mají pipeline poloviční s cca 15-19 stupni.

Dale by mne zajímalo, jestli máte nějaký názor na to, jestli se mohou x86 CPU výkonově (samozřejmě při srovnatelné spotřebě) někdy dostat na úroveň Apple M1? Podle toho, co jsem vyčetl z různých zdrojů, nejspíš máme smůlu, protože pro x86 jsou prý 4 dekodéry instrukcí maximum. Apple M1 má 8 dekodérů instrukcí. Pokud se nějakým trikem nepodaří zrychlit dekódování instrukcí, tak ani nemá smysl přidávat další výpočetní jednotky, rozšiřovat buffery, ..., protože by se procesor často dostával do situace, kdy by neměl k dispozici dostatek dekódovaných instrukcí k vykonání.

+1
+2
-1
Je komentář přínosný?

P4 mala cez 32 a dnes ich je cez 20

Dekóder je štvorcestný ale je tam plánovanie 6 macro -ops

https://www.hwcooling.net/amd-zen-3-ryzen-5000-architektura-detaily-vyle...

a teda IPC môže byť >4 pri 4=cestom dekóderi a kdesi to aj bolo

Edit: tu bolo
Estimated increase in instructions per cycle (IPC) is based on AMD internal testing for “Zen 2” across microbenchmarks, measured at 4.53 IPC for DKERN +RSA compared to prior “Zen 1
https://www.amd.com/en/press-releases/2018-11-06-amd-takes-high-performa...

čiže máte 4--cestný dekóder ale IPC 4,53..

+1
0
-1
Je komentář přínosný?

P4 mala max 31 - jak Prescott tak Cedar Mill,
https://en.wikipedia.org/wiki/Pentium_4

IPC pri 4-way decode na 4 jit nemuze. Protoze si vem FCPU vynasob 4 a vice vstupu to nezpracuje ani za boha.

Takze bud to pocitali jako 4 per thread a dva thready na jadro, nebo je v tom neco jineho. IPC se nepocita v uOps!

+1
+2
-1
Je komentář přínosný?

To je pravda, čo píšete, až na to, že počítanie per thread nenavýši IPC cez 4. Jedine preddekódované inštrukcie, ktoré neťahá z dekódera ale ich mikroprogram ťahá z chache mikroinštrukcií, prípadne tuším 200 položkovej, rescheduling cache. Jediné vysvetelnie je, že tie programy majú veľa cyklov, kde tie predekódované inštrukcie existujú...

+1
+2
-1
Je komentář přínosný?

Tak nejake loop instrukce (napr. ty s rep* prefixem), se zrejme pocitaj ferove podle poctu pruchodu, ne podle poctu vyskytu, takze jo.. souhlasim, ze timto smerem muze byt zakopanej pes.

+1
+4
-1
Je komentář přínosný?

Jedna z fint, které x86 používá pro zvyšování IPC je dekódování několika běžných instrukcí do jedné uop, např. kombinace CMP s podmíněným skokem(macro-fusion).

+1
+1
-1
Je komentář přínosný?

V tabulce u 3800X je chyba, udané takty platí pro model 3700X

+1
0
-1
Je komentář přínosný?

Můj R7 5800x má boost až na 4 950 MHz. Můžu dokázat, pokud by někdo chtěl :).

+1
+1
-1
Je komentář přínosný?

Osobni (necekane) pozorovani.

Presunul jsem se z Skylake 4c8T na Ryzen 5800 8C16T. Ramky jsou temer stejne dobre, zbytek systemu stejny, grafika stale GTX 1080.

Division 2, 4K Ultra (bez AA) stoupl FPS rapidne. 32->53 Avg, 18->30 Min. Z jakz takz datelne se to stalo vyrazne hratelne (nehraju PvP, takze ~40FPS mi staci).

Prekvapilo me, ze kdyz je to 4K, ze narust diky CPU byl tak veliky.

+1
+1
-1
Je komentář přínosný?

Co nejake dalsi hry? Division 2 nehraju, ale mam i7-6700 s GTX1080, takze info, ze bych si s 5800X vyrazne pomohl, je pro me zajimave.

Nezda se mi to teda z toho duvodu, ze na soucasne sestave bezi GK ve 4K na 100%, zatimco i stavajici CPU nema spicky nad 95% a AVG je nekde 65%.

+1
0
-1
Je komentář přínosný?

Hry jako Divinity OS2, atp. jsou mnohem "responzivnejsi", zvlast kdyz se sejde spousta efektu. Ale tam nemam namerene FPSka z predchozi masiny a uz se mi nechce prehazovat disky a grafiku. Mozna po vanocich.

Zkusil jsem i Horizon Zero Dawn a stejna zkusenost, tedy Ultra 4K (minus AA pac na 4k monitoru, pokud nema brutalni uhlopricku, to nema cenu) a FPS se drzi kolem 40FPS, pohoda hratelne.

Hlavne je super, ze minima se drzi konstantne nad 25FPS. Coz je pro me dostacujici. Vypada to krasne. Ja zacinal na Sacrifice na 4MB 3DFx kdyz se textury nevesly do VRAM a bylo to teda mazec, takze mam krapet vetsi tolerance :-D

+1
+1
-1
Je komentář přínosný?

Ok, dik, budu o tom uvazovat.

+1
0
-1
Je komentář přínosný?

Mne pri prechode z 1700X na 3700X stúpli priemerné FPS v Rise of the Tomb Raider z 49 na 99 pri 4K High nastavení (RX 6800 XT). Mafia Remaster podobne (nemám presné čísla), pri RaceRoom Experience či Asseto Corsa už ani neriešim zníženie detailov, všetko na max pri 4K a CPU aj GPU sa už flákajú :D

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.