Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Microsoft zveřejnil testy Milan-X, vliv V-cache je vyšší než rozdíl Zen 2-Zen 3

Jeden den, jeden autor, dva clanky, dve protichodne tvrdenia:

"Procesorová jádra většinou nejsou limitována propustností paměti..."
vs.
"Jednak limitaci danou nedostatkem paměťové propustnosti..."

nu teda, je, ci nie je to limitacia? :)

+1
-11
-1
Je komentář přínosný?

Žádný rozpor. Stačí nevytrhávat z kontextu a nevynechávat další větu, která vysvětluje, o čem je řeč.

+1
+19
-1
Je komentář přínosný?

Konkretne mi slo o tu strasne obecnu formulaciu pri AL. Ze tam existuje workload, ktory z rychlych RAM na tom konkretnom procesore nema takmer ziaden benefit, neznamena, ze by sa nenasiel taky, ktory by benefit mal (aj na AL).

+1
-9
-1
Je komentář přínosný?

No a já upozorňuji, že stačí nevytrhávat z kontextu a žádný rozpor neexistuje, protože první citace je o procesorech a druhá o smyslu cache. Takže to ocituji celé…

„Cache sama o sobě výkon negeneruje, pouze snižuje dva druhy limitací. Jednak limitaci danou nedostatkem paměťové propustnosti a jednak limitaci danou latencemi. V případě procesorů mají hlavní vliv latence (propustnost je klíčová v grafických jádrech).“

…a zeptám se, kde konkrétně je mezi těmi tvrzeními rozpor?

+1
+13
-1
Je komentář přínosný?

si to domotal a teraz sa vyhovaras na "kontext" )))
cakam na desktopove procesory od amd z pcie 5 ...stale cakam..))) ako sa pisalo na anandtech ,,amd proste prcha z desktopu a vsetko vali na server produkty,,, a apple stale plati tsmc najviac a tak apple dostane to najlepsie, aby sa nahodou nestalo ze amd nestihne vydat ryzeny 4 pred intel ,,v 2022))

+1
-15
-1
Je komentář přínosný?

chlapce, chlapce, dyt ty nechapes ktera bije.. ((:

Dukuk
Účet existuje již
2 měsíce 2 týdny

+1
+8
-1
Je komentář přínosný?

Kdybych o někom řekl: „Ty jsi debil, pokud to máš potvrzeno doktorem.“

Kdyby to někdo vytrhl z kontextu, tak by se ohradil, že jsem mu prostě nadal do debilů. Ale kontext jasně říká, že jsem pouze uvedl podmínku, za které by to platilo.

Takže kontext je často právě to nejdůležitější.

+1
+12
-1
Je komentář přínosný?

"... cakam na desktopove procesory od amd z pcie 5 ...stale cakam ..."

Doporučuji tu dobu čekání využít na zopakování si lekcí jazyka.
Skloňování ti moc nejde.

BTW ... jaké použití má PCIE 5 v desktop PC v současné dobe (+1 rok)?

+1
0
-1
Je komentář přínosný?

PCIe 5 má zatím daleko větší význam v serverech než desktopu, zatím PCIe 4, která je stále ještě celkem nová, v desktopu stačí. Spíš by některým konfiguracím pomohlo pár linek navíc. Proto existují ty nejslabší procesory pro HEDT, kde to má smysl právě pro počet PCIe linek a paměťovou propustnost a kapacitu.

+1
0
-1
Je komentář přínosný?

"cakam na desktopove procesory od amd z pcie 5"
Dukuk... tak to sa nacakas velmi dlho! Nepoznam firmu, ktora by z akehokolvek portu PCIe X dokazala vyrobit procesor.

+1
0
-1
Je komentář přínosný?

Ako by povedal politik - jak kdy :-)

+1
+3
-1
Je komentář přínosný?

Mikroarchitektúra Intelu býva tradične citlivejšia na priepustnosť ako na latencie čo sa týka výkonu
Mikroarchitektúra AMD býva tradične citlivejšia na latencie ako na priepustnosť čo sa týka výkonu

To je ďalší argument popri tých, čo ste už dostali od autora/reakcie

+1
-3
-1
Je komentář přínosný?

Ale no. Pre stromy nevidime les. To na com narazam je ta obecna formulacia uvedena v clanku pri AL. Moze byt AL citlivejsi viac na priepustnost ako na latenciu RAM, ale pamat ho pri memory bound algoritmoch brzdi tak isto, ako brzdi prakticky kazdy jeden procesor snad od cias prvych Pentii, alebo 486tiek, ktore mali nasobic frekvencie CPU voci zbernici. Ako velmi bude brzdeny v realite zalezi na algoritme, velkosti datasetu a velkosti cache. Ale k nulovemu brzdeniu sa pri real world ulohach prakticky nie je mozne dopracovat. Ak by procesory RAMkou brzdene neboli, tak sa koniec koncov mozeme na celu cache vybodnut. Nie?

+1
0
-1
Je komentář přínosný?

> Ak by procesory RAMkou brzdene neboli, tak sa koniec koncov mozeme na celu cache vybodnut.

Samozrejme za predpokladu. že nemáme dosť registrov na celý dataset.

cache má nižšiu latenciu aj vyšší dátový tok a teda zlepšuje oba parametre

Ale aj AMD pri V-cache uklazuje 100 nižšiu latenciu stackovanej cache oproti cache veďla výkonných jednotiek.
https://www.youtube.com/watch?v=Uh3WobaaP70&t=210s

A tam nikde sa nehovorí o kapacite linky. Sranda je, že vlastne latencia V-cache je oproti bežnej zanedbateľne vyššia, ale ak by bola celá cache nad výkonnými jednotkami, tak sa zníži latencia cache skoro na/pod úroveň latencie registrov. A len toto Vám dá neskutočné možnosti na rast výkonu v špecifických úlohách.

+1
+1
-1
Je komentář přínosný?

"Ale aj AMD pri V-cache uklazuje 100 nižšiu latenciu stackovanej cache oproti cache veďla výkonných jednotiek"

To video dava smysl.... ale IMO to neni uplny obrazek. Ta stackovana L3 je sice nad, co usetri tu "cestu", jenomze na druhe strane je mnohem vetsi - pokryva i jadra. Cestu toho signalu bychom mohli rozlozit na dve casti: 1) od jadra po L3, a 2) uvnitr L3. V nejhorsim pripade ten signal cestuje az na hranu chipu. Takze to 1000x-krat zlepseni (o kterem mluvi ve videu) plati jenom pro 1), a celkova latence cache nebude zas o tolik lepsi.

Z toho co jsem cetl, maji byt dva L3 cache - jedna bude 32MB vedle jader, presne jako u Zen 3, a pak bude ta stackovana 64MB / CCD. Hlavni vyznam stackovani je to, ze kdyby jste chtel tech extra 64MB L3 bez stackovani, tak by musela byt nekde kolem soucasneho CCD, coz by zvysilo latence mnohem vic.

+1
+3
-1
Je komentář přínosný?

áno

+1
+1
-1
Je komentář přínosný?

Teoreticky jde udělat procesor tak, že bude mít násobně víc registrů v jádře, větší všechny cache a s takovou datovou propustností až po paměťový řadič, aby nikde nebylo slabé místo. Ale co to reálně udělá s efektivitou? Plocha i spotřeba vzrostou víc než reálný výkon a tedy i cena za pořízení i provoz. Proto je každá architektura optimálně vybalancovaná, aby co nejvíc vynikly výhody a byly potlačeny nevýhody. Samozřejmě tím, že je efektivnější zvyšovat počet jader než takt, u kterého jsme i tak blízko fyzických limitů, je toto vybalancování stále obtížnější.

+1
0
-1
Je komentář přínosný?

jasné..

+1
+1
-1
Je komentář přínosný?

Otázka je jak to těží... některé CPU coiny vydělávají víc nez ether na garafikách..

+1
0
-1
Je komentář přínosný?

Odpověď už se ví.. těží to dobře..Vivat Raptoreum .-) A je to lepší kšeft než Ether.

+1
+1
-1
Je komentář přínosný?

V-cache dle meho nazoru prinesla reseni ne 2 ale rovnou 3 citelnych prvku/veci a to:

->snizeni latenci(do velke cache se vejde vice dat, neni nutno neustale sahat do operacni pameti)
->navyseni propustnosti(cache je oproti operacni pameti bleskove rychla, jadra maji kam zajit)
->snizuje narok na nutnost pridavani dalsich pametovych kanalu coz je v serverech zadane

Zakaznik tak ziska procesor ktery si vystaci i s mene nakladnymi operacnymi pametmi co se CL tyka, tez usetri na nenutnosti kupovat si procesor s vice kanalovym integrovanym radicem pameti, tohle je cesta pro planovanou architekturu Zen 4 a 5, jiz u DDR4 to hodne prinese, u DDR5 s vysokymi CL nemluve, zada si to rovnou Rembrandt s V-cache a DDR5, s RDNA II by to byla skutecne pecka.

+1
+1
-1
Je komentář přínosný?

Každý nový typ operační paměti už od přechodu SDRAM na DDR a pak každou další generaci, znamenal nárůst jak propustnosti, tak latence, ale protože multijádrové CPU zpočátku neexistovaly, nebyl ten vliv tak výrazný. Přesto už tehdy existovaly procesory u kterých existovalo více variant dle velikosti cache. A opravdu nemyslím Celeron a Pentium II nebo III. Ten, který mám na mysli jim předcházel a šlo o Pentium Pro. Tam se prodávaly varianty dokonce tří velikostí L2 cache a cenové rozdíly byly dost velké. Přesto se už tehdy někomu vyplácelo připlatit. A to stále nebylo nic, proti složitějším ale také mnohem výkonnějším konfiguracím především víceprocesorovým i grafických stanic SGI, které byly datovou propustností jak mezi CPU, RAM i do grafického subsystému na jiné planetě. Fakticky vývoj, který tehdy zákazníci u těchto unixových strojů platili, se stále více uplatňuje nejen v současných serverech a pracovních stanicích, ale i běžných PC.

+1
0
-1
Je komentář přínosný?

Velká cache je součástí serverových CPU již velmi dlouho, udržet maximum kódu/dat obsluhovaných vláken v cache je prakticky nezbytností pro dosažení slušného výkonu.

+1
+1
-1
Je komentář přínosný?

Ano, ale jde o to, že spousta věcí potřebných pro vysoký výkon jako: Velká cache, vysoce propustné sběrnice, typy propojení vhodné ke komunikaci většího počtu jader, se postupně stávají standardem ve stále nižší cenové kategorii. A kdyby se ty technologie a způsoby aplikace nezaplatily na tehdejších serverech a pracovních stanicích, dnes by celý potřebný vývoj platili stávající kupující.

+1
0
-1
Je komentář přínosný?

Bez pridavani jader by dnes vykon nerostl ani u low endu. IPC ma sve relativne pomale tempo vyvoje a na frekvenční stropu jsme jiz pres dekadu. Pridavani jader a zajisteni dostatku infrastruktury(sbernice) a zdroju(cache) je umozneno pokrocilejsimi vyrobnimi procesy samorejme v ruku v ruce s pokrokem SW na poli paralelnich algoritmu.

Pozn. Zen chiplet je spolecny desktopu(Ryzen) i serveru(Epyc). S ohledem na podil v jednotlivych segmentech v predchozi dekade to byl desktop, kdo platil vyvoj pro server. ;-)

+1
0
-1
Je komentář přínosný?

Samozřejmě. To že např. ThreadRipper vůbec být neměl a existuje je právě důsledek toho, že nikdo nemusel navrhovat nový monolit, ani serverový monolit nějak modifikovat, jen jinak zapojili CPU chiplety (u první generace) a nakombinovali vhodně CPU chiplety a centrální chiplet u dalších generací. Vlastně až na úplně novou V-Cache jsou všechny konfigurace mimo APU od desktopu po server jen variace na jedno téma. A s serverech to umožňuje navíc kombinace různě optimalizované - na počet nízkou spotřebu, počet jader, velikost cache a nebo maximální takty.

+1
0
-1
Je komentář přínosný?

S ohledem na podil v jednotlivych segmentech v predchozi dekade to byl desktop, kdo platil vyvoj pro server. Protože už od začátku tu kromě tehdy zvaných mikro a minipočítačů byla také kategorie mainframů a k nim po síti připojených dost "hloupých" terminálů. Kromě toho, kdo opravdu potřeboval matematický výkon a měl na to peníze, koupil superpočítač. A právě tehdejší mainframy a superpočítače, v naprosté většině ukázaly směr dalšího vývoje budoucích serverů a až později se k tomu přidaly i grafické pracovní stanice a ty posílily jak vývoj serverů - ostatně existovaly i specializované grafické servery - tak budoucích PC pracovních stanic. Takže na ty výkonnější aplikace tu vždy bylo speciální řešení a dnes se vlastně svět serverů, pracovních stanic a osobních počítačů (včetně mezistupně mezi stanicí a PC - tedy hi-end desktopu) stále více stýká a má stále více společných prvků. Navíc se jednotlivé kategorie i více překrývají. Např 16. jádrový ThreadRipper jako hi-end - pravda na starším jádře - a 16. jádrový desktop jsou blízko výkonem CPU, ale už paměťovou propustností a počtem PCIe linek už jsou poněkud jinde.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.