Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Ovladače AMD Adrenalin 26.2.2 zvyšují výkon v Marathon o 13-16 %

Další sračka co se musí fixovat v ovladači...

+1
+2
-1
Je komentář přínosný?

To můžete zopakovat u všech "game ready" driverů. To je ten dnešní "vibe coding"

+1
+2
-1
Je komentář přínosný?

Tohle to tu bylo dávno před nějakou AI. :)

+1
+1
-1
Je komentář přínosný?

Čekal bych že Ryzen 9 9900X složený s dvou CCD bude mít větší rezervy v rozložení zátěže než 9800X3D.
FPS to nepotvrzuje.
ALE latence se podařilo dostat z 11,8 na 8,7 ms.
Což je méně než 9800X3D před optimalizací.

Takže tudy vede cesta k odstranění problémů s dvěmi CCD. Škoda že to přišlo tak pozdě. ZEN 6 to vyřeší i bez optimalizací.

+1
+2
-1
Je komentář přínosný?

Pro Zen6 se ty optimalizace budou hodit u > 16 jader.
... a všech ostatních kombinací, kde je X + Y jader rozhozených po různých CCD nebo CCX.

+1
0
-1
Je komentář přínosný?

Ne.
Optimalizace pro Ryzen 9* nebude potřeba.
ZEN 6 chystá
"těsné spojení křemíkem s nižšími latencemi"
Viz
https://diit.cz/clanek/na-v-cache-se-zen-6-se-nic-nemeni-prime-spojeni-c...

*bavíme se o 16, 20 a 24 core.
https://diit.cz/clanek/zen-6-pro-am5-bude-existovat-v-6-8-10-12-16-20-24...

+1
0
-1
Je komentář přínosný?

Každé CCD ale stále bude mít vlastní L3 cache, takže pokud bude jádro v jednom CCD vyžadovat data, která nejsou v jeho L3 cache, ale ve druhé se nacházejí, bude pro ně muset sáhnout do RAM. Tato situace sice bude méně pravděpodobná (více jader připojených k větší L3 cache) a penalizace bude nižší (menší latence mezi CCD a RAM), ale nezmizí.

+1
+2
-1
Je komentář přínosný?

Já jsem optimista.
+1) Latence mezi CCD klesnou natolik že L3 ve vedlejším chipletu bude rychlejší než RAM.
Což dneska není?
+2) Největší problém má Ryzen 9900 s konfiguraci 2×6 protože 6jader je už někdy brzdou. Tuto konfiguraci nahradí nativní 12core.
Ostatní konfigurace nemají tak citelné propady.

- na druhou stranu je pravda že optimalizace bude i tak prospěšná. Viz test 9800X3D.

+1
0
-1
Je komentář přínosný?

CCD nejsou přímo propojená.

https://hww.ru/wp-content/uploads/2025/09/ccd_iod.png

Pokud by jádro jednoho CCD mělo brát data z L3 druhého CCD, musela by ta data jít přes IOD. A tam už není rozdíl oproti tomu, když jdou z RAM. Teoreticky to může být i výhodnější, protože takový přesun neukrajuje z datové propustnosti mezi druhým CCD a IOD.

+1
+1
-1
Je komentář přínosný?

Na obrázku má jedno CCD 8core.
Takže to není schéma od ZEN 6.
Vidím bottleneck; 16B/cycle write.
Takže čtení z druhého CCD jede poloviční rychlostí než čtení z RAM.
ZEN 6 určitě musí zvednout propustnost FCLK.
Protože přidává 50% jader + IPC.
RAM zůstane DDR5, takže cache v druhém chipletu se bude hodit.

+1
0
-1
Je komentář přínosný?

Na generaci nezáleží, to platí pro všechny. CCD nejsou vzájemně propojena a ani to nedává smysl, dokud (pokud) nejsou připojená ke společné L4 cache, přes kterou by mohla sdílet data.

+1
+3
-1
Je komentář přínosný?

OK.
Nechci znevazožovat Vaše schopnosti.
Jistě máte pravdu.
Ale návrh něčeho tak složitého jako je chipletový CPU je mimo schopnosti nás všech.
Velké potíže s tím má i intel.
A jak si vede Apple se brzy uvidí.
(vypadá to že chipletová je jen GPU)

9900X má penalizaci kvůli dvoum CCX.
Věřím že nové pouzdření bude tyto nedostatky eliminovat. Jinak by nemělo moc smysl ho nasazovat. Možná je to jen nutnost aby vyřešili větší nároky na propustnost, ale jsem optimista.... uvidíme... za půl roku budou venku první testy.

+1
0
-1
Je komentář přínosný?

Optimista == špatně informovaný pesimista

+1
0
-1
Je komentář přínosný?

>> *bavíme se o 16, 20 a 24 core.

Ne.
Bavíme se o všech Ryzenech, které vykazují latence z důvodu rozdělení jader do skupin, které nejsou na stejné L3.

Kromě Ryzen 9 to zahrňuje i Strix Point/Gorgon Point, Pheonix 2 a všechny další kombinace Zen6 (+Zen6), které vzniknout kombinací CCD + IOD.

>> Optimalizace pro Ryzen 9* nebude potřeba. ZEN 6 chystá
>> "těsné spojení křemíkem s nižšími latencemi"

Ty latence to nezlikviduje.
Jen o něco sníží.
Proti latenci mezi jádry sdílejícími stejnou L3 to pořád bude násobek.
Takže se optimalizace budou hodit, jen už jejich přínos bude relativně menší.

+1
+2
-1
Je komentář přínosný?

"Proti latenci mezi jádry sdílejícími stejnou L3 to pořád bude násobek."

V-cache je jiný chiplet. A vůbec ničemu to nevadí. Díky těsnému spojení jsou latence skoro stejné jako by to byl monolit.

+1
+1
-1
Je komentář přínosný?

Je hezky.
Zajděte si do přírody.

A pořádně si odpočiňte, než ze sebe zase budete dělat .... neinformovaného optimistu.

+1
0
-1
Je komentář přínosný?

Děkuji za radu.
Pomohlo to.
Velké latence lze vyrobit i v monolitu.
Záleží na návrhu. Například intelácký ring-bus od 10 jader/zastávek a více s tím má velké problémy.
Chipletová architektura AMD připomíná spíš hvězdicovou topologii. Kde prvky mezi sebou komunikují přes centrální chiplet.
Ano, na první pohled je jasné že komunikace bude delší.
Ale nemusejí to být násobky jak uvádíte.
Můžou to být jen procenta, která lze zanedbat.
+ Vzdálenosti jsou výrazně zkráceny.
+ Dost se vylepší výrobní technologie.
Menší tranzistory jsou rychlejší.
IOD bude na 3nm což je o generaci lepší než 4nm u současného CCD. A výrazně lepší než současné IOD na 6nm.

Takže latence mezi chiplety mohou být podobné na V-cache v 5800X3D, který se vyráběl na 7nm.

+1
0
-1
Je komentář přínosný?

Já si počkám na nějaké solidní měření.
Phoronix nebo Chips & Cheese.

Murphyho zákon o nevýhodě optimismu:
"Optimista nemůže být příjemně překvapen."

+1
0
-1
Je komentář přínosný?

S tím souhlasím.
Jen latence dělají největší neplechu v herní zátěži. Letošní hry si vystačí s osmi jádry.
Takže to nemůže dopadnout špatně.

Můžeme jen porovnávat latence a domýšlet jaký dopad budou mít na reálný výkon až budou hry co potřebují 12 jader.
Pomocí tohoto:
https://github.com/nviennot/core-to-core-latency
Lezou z toho nádherné obrázky.

PS
Phoronix testuje výhradně pod Linuxem.

+1
0
-1
Je komentář přínosný?

To je sice pěkné, ale zachvili ty ovladače amd nebude mít pro koho dělat😀

https://www.jonpeddie.com/news/q425-pc-graphics-aib-shipments-decreased-...

Trochu jiné počty než tu nedavno mistr No-X psal z midfactoty🤔

+1
0
-1
Je komentář přínosný?

A jsou tam započítané i auta, konzole či třeba mobily nebo jen to, ať to vždycky vyjde tak, jak dotyčný potřebuje? Osobně bych nevěřil žádné statistice, kterou si sám nezfalšuji, asi mají odbyt celkem dobrý, když to pořád nevykazuje ani žádné ztráty, lidi ať si počítají co chcou, očividně jim i těch pár procent, co jim někdo spočítá, stačí na to, aby to dokázalo přežít, tak jim to můžeš poslat, že podle tvého názoru jsou vlastně zbyteční a proč se vůbec snaží.

+1
0
-1
Je komentář přínosný?

Z toho může mít radost jedině omezenec. V podstatě to znamená jen smutný fakt, že budou GPU ještě dražší. Pochopitelně všechny.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.