Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Dual V-Cache Ryzen 9 9950X3D2 se 192 MB L3 ohlášen, vydán bude 22. dubna

veru tu energiu a vyrobne kapacity a suroviny mohli investovat do gpu radsej ako taka somarina

+1
-6
-1
Je komentář přínosný?

Taky investovali.
Do MI4xx.

Tohle jsou zbytky, co se neměly dost dobré parametry pro Epyc.
A je to dost dobré aby se o tom psalo a dělalo to reklamu.

+1
+8
-1
Je komentář přínosný?

A to jsem tu četl názorů, že nebude, protože by to bylo k ničemu...

+1
+5
-1
Je komentář přínosný?

K ničemu?
Použít se to dá ... pokud to neodpálí deska :(

Všimněte si, komu to nabízí.
Pro hráče se to nevyplatí.
Pro vetšinu aplikací nárůst výkonu neodpovídá nárůstu ceny.
Příprava dat pro A.I. a menší modely počítané přímo na CPU tu cenu zaplatí velmi rychle.

+1
-5
-1
Je komentář přínosný?

Ja jsem odhadoval ze nebude, ale ne protoze by byl k nicemu - spis proto ze Intel nevydal nejvyssi 290K v ramci refreshe. No nic, mylil jsem se, nakonec bude prijemne prekvapkani.

Na hry je to zbytecne (to jsou IMO na 99% her vsechny soucasne ryzeny >8 jader), ale pokud na stejnem PC nekdo i pracuje, muze to mit vyznam, pokud ta pracovni zatez tezi z L3 cache.

+1
+2
-1
Je komentář přínosný?

Však z herního hlediska to oproti Ryzen 7 9850X3D nemá přínos a z aplikačního jde o niche záležitost. Je to spíš stop-gap produkt, aby letos vyšel nějaký nový Ryzen 9.

+1
+2
-1
Je komentář přínosný?

Tak forbesáři mají teď problémy někde úplně jinde.

A jasně, že je to niche, jako skoro cokoli v téhle kategorii.

+1
0
-1
Je komentář přínosný?

"A jasně, že je to niche, jako skoro cokoli v téhle kategorii."
.. 16C ryzen bude samzorejme vzdycky "niche product", pokud se srovnava s mainstreamem. Nicmene 16C ma svuj vlastni trh a v tomto trhu bude 9950X3D2 niche, protoze aplikacne oproti 9950X pridava malo a herne oproti 9950X3D pridava malo. Oba dva jsou levnejsi. Proto je to "niche product", protoze v ramci sve vlastni kategorie, pridava za priplatek malo.

+1
+2
-1
Je komentář přínosný?

S generací Zen 7 by 16C ryzen mohl být mainstream produkt :-)

+1
+2
-1
Je komentář přínosný?

Jiz Zen 6 nam nakousne Threadripper serii, Zen 7 jeste vic .-)

Predpokladam Threadripper Zen 6 koncici na 144 jadrech, Zen 7 na 192.

Prece se to zaplati.

+1
0
-1
Je komentář přínosný?

Největší procesor postavený na jádrech Zen 6 má být 96jádrový (tj. 8× 12C čiplet). Vše s vyšším počtem jader má stát na Zen 6c (8× 32C čiplet). Threadripper většinou bývá cílen na vyšší takty než Epycy, ale céčková jádra nejsou na vysoké takty příliš vhodná. Takže bych se nedivil, kdyby Threadripper zůstal na 96 jádrech a výš šel až se Zen 7 (8× 16C čiplet = 128 jader).

+1
+1
-1
Je komentář přínosný?

> protoze aplikacne oproti 9950X pridava malo

To zalezi od aplikace. Dovolim si odhadnout ze v AI nebo AVX512 zatezich to prida desitky procent. Jestli je to "malo" to zalezi na uzivateli...

+1
+1
-1
Je komentář přínosný?

Proc by mel v AVX512 pridavat desitky procent? Jako, ze vetsi cache prida desitky procent?
Neverim

+1
0
-1
Je komentář přínosný?

Věřte si čemu chcete.

Architektura x86 má jeden velký problém - dekódování instrukcí.
Pomocí různých fint, µOp chache a dalších opatření se dosaneme někam k 6 Instrukcím.
Největší výhodou AVX-512 je, že umožní zvýšit propustnost zpracování dat nad rychlost, kterou by šlo dosáhnout klasickými instrukcemi.

A pak je potřeba tam ta data dodat.

Smotné AVX-512 pomáhá.
Velká cache pomáhá.
Ale synergický efekt použití obou zároveň ... desítky procent dá.

+1
0
-1
Je komentář přínosný?

Nemali hry s R9 9950X3D problémy kvôli tomu, že hra preskakovala na druhý chiplet? X3D2 to vyrieši.

+1
0
-1
Je komentář přínosný?

Latence mezi CCD <=> CCD jiz AMD poresila(snizila) a to vydanim noveho mikrokodu a rovnez ovladaci, ja problem v Ryzen-u 9 9950X3D2 tedy nevidim, samozrejme jeho vykon vypilovanim dal poroste, k tomu kto bude chtit efektivnejsi beh, nastavi si prece negativny offset na curve optimizer v PBO v rozmezi -20 az -30 a nebo zvoli ECO mod, pujde tak o produkt s kterym clovek hrave vydrzi az do mikroarchitektury / generace Zen 7, 16 jader(32v) + velka L3 cache a takty sahajici ke 6GHz...

+1
+4
-1
Je komentář přínosný?

vazeni - vsetko je to o specifickom nazadeni !
pozrime sa na luskanie mersennovych prvocisel v Prime95

sustredme sa na 8M FFT size:

Ryzen 9 9950X3D : 774 it/s
https://www.mersenne.ca/benchmark/AMD/Ryzen_9/Ryzen_9_9950X3D

Ryzen 9 9950X : 454 it/s
https://www.mersenne.ca/benchmark/AMD/Ryzen_9/Ryzen_9_9950X

Ryzen 9 7950X3D : 728 it/s
https://www.mersenne.ca/benchmark/AMD/Ryzen_9/Ryzen_9_7950X3D

Ryzen 9 7950X : 422 it/s
https://www.mersenne.ca/benchmark/AMD/Ryzen_9/Ryzen_9_7950X

proste pri luskani mersennovych prvocisel v Prime95, su modely s 3D cache cca o 70% rychlejsie !!!!!!
(vzdy uvazujem so 16-jadrom kde 3D cache bola na jednom chiplete)

tipujem ze X3D2 bude 2,0x-2,2x (t.j. o 100% az o 120%) rychlejsi v luskani mersennovych prvocisel v Prime95 v porovonani s non-3D modelmi

vazeni, tu ide o to ze luskat mersonove prvocisla na VGA (v GPUowl programe) ci hladat delitele na VGA (v mfaktO programe) bude na 16C32T CPU 9950X3D2 UPLNE POROVNATELNE s vykonom na VGA RX 7900XT(X) ... a to uz je riadna sila .... proste otestovat exponent v oblasti 140-150 mega (kde su dnes prve testy), bude na 9950X3D tiez trvat 2,5 dna cisteho vypoctovejho casu (rovnako ako na grafike)

+1
+1
-1
Je komentář přínosný?

> proste pri luskani mersennovych prvocisel v Prime95

No jo. Ale hadam ze "luskani mersennovych prvocisel" konkretne asi neni zatez, ktera by zajimala velkou cast zakazniku. Je to spis benchmark nez neco uzitecneho.

Spis jde o to, ze ta velka L3 pomuze vsude tam, kde se dela nasobeni velkych matic nebo vektoru, jako treba AI inference, nebo jine AVX512 vypocty. Tam to IMO zvedne vykon klidne o desitky procent. Ten duvod je jednoduchy, staci si udelat maly vypocet:
1) rekneme ze mas DDR5 o propustnosti 64GB/s
2) pri 16 jadrech to vychazi na 4GB/s na jadro
3) pri konzervativni 4GHz all-core frekvenci to vychazi na 1byte / cyklus.

Tj pri plnem zatizeni CPU muze jedno jadro udelat jeden AVX512 load/store z/do DDR5 kazdych 64 cyklu. Kdyz si vemes ze Zen5 jadro umi 2x FMA + 2x FPADD kazdy cyklus, za 64 cyklu to dela 256 instrukci. Vysledek je, ze abys plne vytizil jadro Zen5 s AVX512, musis na kazdy jeden DDR5 AVX512 load/store udelat ~256 instrukci. Absurdni, ale je to tak. Teoreticky vykon pri vyuziti AVX512 tech 9900X/9950X Zen5 se pohybuje kolem 2-5 TFLOPS, problem je vzdy pamet.

TLDR: L1/2/3 cache hraje dnes extremne velkou roli ve vykonu procesoru, hlavne pokud chce clovek naplno vyuzit jeho FP jednotky.

V nekterych hrach to muze pomoct taky, treba BeamNG.drive, Factorio, kde bezi na pozadi AI nebo simulace, ale to jsou spis vyjimky.

+1
0
-1
Je komentář přínosný?

jo, ved preto pisem, ze pri specifickyxch kejsoch kde na velkej L3 cache zalezi a kde sa data zmestia do tej L3 cache, resp. ma relevantnu velkost (a o kejsoch o ktorych BFU prakticky ani netusi), vykon 9950X vs. 9950X3D2 stupne ani nie ze o desiatky percent, ale 2-nasobne

(napr. v tom Prime95 vyhoda 9950X3D2 vs. 9950X konci pri 12M FFT size, vsetko nad je uz nad moznosti tej 3D cache, takze exponenty v rozsahu 332 mega (miliarda-cirefne mersonnove prvocislo) pojdu rovnako ako na bez 3D cache ...)

+1
0
-1
Je komentář přínosný?

aaaaaa pardon - exponent v range 332 mega = 100 milion ciferne mersonnove prvocislo

+1
0
-1
Je komentář přínosný?

Top End přece nikdy neni pro každého.

+1
0
-1
Je komentář přínosný?

Veď to nie je nič extra drahé. Ak niekto náhodou potrebuje pracovné PC s RAM viac ako 64GB, tak cena za CPU ho nebude vôbec trápiť. Ale DDR5, ktoré už mimozemšťan ponúka na splátky, to je fakt chuťovka....

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.