Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Epyc Genoa: 90 miliard tranz., 432 Gb/s na socket, 24 jader stačí na Xeon 8380

Jo, Pat asi v rámci projektu "A je to" vyměnil zpětné zrcátko za kameru před předním sklem...

+1
+9
-1
Je komentář přínosný?

Pat uz ma aj alobalovu ciapku na hlave.

Ked 24C Epyc Zen4 dotahuje absolutny vrchol sucasnej ponuky 40C Xeon IceLake, tak Intel je v server segmente dost v prdeli.
Vidno to aj na tom, ze najvykonnejsi serverovsky CPU AMD je 2,5-nasobne vykonnejsi ako u Intelu.
Intel (a aj to iba z vykonoveho hladiska a iba na cely system) zachranuje jedine to, ze ponuka 4- a 8-socketove systemy, AMD max. 2-socketove.

Potom 56C Saphire Raphids bude mat dost velky problem s 64C Epyc Zen4 (a zrejme iba prekona 48C Epyc Zen4) a pytam sa cim chce Intel najblizsie 2-3 roky konkutrovat 84C a 96C Epyc Zen4, lebo ziadne 72-80 jadrove serverovske CPU do jedneho socketu Intel najblizsie 2-3 roky iste nevyda, pricom AMD bude za tri roky mat trhu etablované 128C256T Epyc Zen5 a mozno nejake 192C384T Epyc Zen5c v jedinom sockete a Intel bude pozerat na samotne dno benchmarkov, ze kde je spickovy 56C Xeon model Saphire Raphids.

+1
+7
-1
Je komentář přínosný?

Píšem to tu často... Náš jeden veľký zákazník, globálna svetoznáma firma, ešte stále beží na 2S Xeon E5-2697 v3 pre non-HANA, a 4S E7-8890 v4 pre HANA, to sú Haswell a Broadwell CPU z rokov 2014 a 2016. Tak si nerobme ilúzie, že enterprise mení servre každý rok... No a náš slávny cloud, niektoré staršie clustre bežia ešte stále na HPE BL460c G7, kde sú Xeony X56xx, čo sú Wesmere EP, čo je vlastne servrový Core2 :)

+1
+1
-1
Je komentář přínosný?

To, že vám staré části cloudu běží na starých serverech, je přirozené. Ajťáci nechtěj šahat na něco, co funguje. U nás např. MS SQL Server měl už 13 let (nainstaloval ho hlavní ajťák, když před 13 lety přišel do firmy a od tý doby leháro). Tj. 3 roky už nedostával ani security updaty (ale bezpečnost maj přece pokrytou firewallem, který před lety nastavili a od té doby klid - naučil jsem se od nich slovo "perimetr"). Spojili jsme se programátoři a dotlačili je, aby ho upgradovaly (někteří si stěžovali, že nemohou používat v SQL ani 10 let staré funkce). Samozřejmě upgradem všechno rozes*ali, a pak se to opravovalo přes víkend, např. formuláře na webu, a úlohy v Task Scheduleru přemigrovali jako Disabled a nikomu o tom neřekli, takže o 2 dny později lidi hlásili, že to a támhleto nefunguje.

+1
+1
-1
Je komentář přínosný?

to je pochopitelne (teda ako pre koho), ked sa zazrakom zo dna na den objavi carovny CPU, server segment ma zotrvacnost 6-8 rokov, mozno aj dekadu

nijako to vsak neprotireci tomu, kto ma ake produkty aktualne na trhu

z toho len plynie iba smutny fakt, ze ak chce amd zvysovat svoj podiel v server segmente, musi byt lidrom dlhocizneeeeeee roky

+1
0
-1
Je komentář přínosný?

Tak ohledně zisků tě zajímá jen podíl v prodaných serverech. Ledaže bys prodával "jako službu" (u procesorů asi nebývá).

+1
0
-1
Je komentář přínosný?

Hezke. Treba se jim v pristi generaci podari dohnat pametovou propustnost M1 Ultra ;-)

+1
-11
-1
Je komentář přínosný?

Tak ale Genoa ma az 6TB RAM na socket a M1 Ultra ma maximum 128GB.

+1
+12
-1
Je komentář přínosný?

Proč? Když se využijí v MB dva Epycy podobně jako je M1 Ultra slepencem dvou M1 Max, tak mají v paměťové propustnosti již navrch 920GB/s (460GB/s/socket) proti 800MB/s? A to čistě pro potřebu CPU jader! ;-)
https://i0.wp.com/macdailynews.com/wp-content/uploads/2022/03/220308_m1_...

+1
+14
-1
Je komentář přínosný?

Ona bohatě stačí ta první věta - Proč?

+1
+6
-1
Je komentář přínosný?

To neni tak jednoduche protoze propojeni mezi procesory vnasi citelnou latenci a omezenou propustnost, vznika tak NUMA architektura - pristup plnou rychlosti mas pouze k polovine pameti.

+1
0
-1
Je komentář přínosný?

A vy si snad myslíte, že když se na M1 Ultra spustí 3D rendering že CPU jádra budou mít k dispozici víc než polovinu memory bandwidth? That's a good one.

+1
+1
-1
Je komentář přínosný?

Třeba se M1 povede škálovat lineárně alespoň v ideálně paralelizovatelných GPU tascích? (Apple M1 Ultra +100% více cores = pouze +60% výkonu navíc)

+1
+3
-1
Je komentář přínosný?

Neskaluje to asi z toho dovodu, ze ty procesory maji extremne nizko nastaveny limit prikonu. Thermal envelope Mac Studio by zvladl v pohode dvojnasobek. Apple ale pravdepodobne dela umely odstup mezi Mac Studio a budoucim Mac Pro.

+1
0
-1
Je komentář přínosný?

Proč? Tu má M1 kvůli integrované grafice.

+1
+6
-1
Je komentář přínosný?

Problém M1 je, že Apple zatím neumí spojit hodně jader CPU, takže výkon nahání přes jádra GPU, ale ani ta mu moc dobře neškálují (ale aspoň to běží). Tohle jsou věci, kde je pozadu za AMD, Intel, IBM apod. Ale s každou generací se zlepšuje, např. M2 nahnal nemálo multithread výkonu na lepší komunikaci s ostatními CPU jádry.

+1
+1
-1
Je komentář přínosný?

Unifikovaná paměť M1 je požehnáním i prokletím. Schopnost předávat si data mezi CPU a GPU úlohami pouhým odkazem oproti masivním přenosům z RAM do VRAM přes IO(PCIe) je nezpochybnitelná. Na druhou stranu se se zde setkávájí úlohy (CPU/GPU) se značně odlišným charakterem požadavků přístupu do paměti.

Je to asi jako by člověk provozoval OLTP a Data-Mining v jedné DB(storage).

+1
+1
-1
Je komentář přínosný?

To je snad jedno kvuli cemu tam je. Tu propustnost ma k dispozici i CPU.

+1
0
-1
Je komentář přínosný?

To je jako kdyby ředitel vytýkal krmiči v ZOO, že tygrům místo masa předhodil seno. A krmič se hájil tím, že na nich přece nešetřil, když jim toho sena dal hodně.

CPU jádra sice onu propustnost k dispozici mají, ale nedokážou ji využít. CPU jádra jsou spíš než na propustnost citlivá na latence, oproti tomu GPU dokážou tolerovat latence, ale vyžadují vysokou propustnost.

+1
0
-1
Je komentář přínosný?

To bude dost záležet i na spuštěném algoritmu.

+1
0
-1
Je komentář přínosný?

Člověk by se chtěl těšit, že zlevní starší EPYCy na socketu SP3, především Rome a Milan, ale spíš to vypadá tak, že Genoa bude stát majlant...

+1
+1
-1
Je komentář přínosný?

Vypadá to na majlanty dva. Epyc 9254 s list price 2299US$ je nabízen v ČR za 75440Kč bez daně (což je vzato přes aktuální kurs 3200US$). :-(

Dtto same v UK, 2699£ ~ 3175US$.
https://www.scan.co.uk/products/amd-epyc-9254-s-sp5-5nm-zen-4-24-core-48...

+1
+2
-1
Je komentář přínosný?

Tento jev snad nebyl pozorovan od nastupu Rome (kdy Naples zlevnily).

Cenové rozdíly Rome/Milan na vzdory výkonostnímu rozdílu jsou prakticky minimální.
https://smicro.cz/rome-7402p-up-24c-48t-2-8g-128m-180w-4094-hf-rohs-100-...
https://smicro.cz/amd-epyc-milan-7443p-up-24c-48t-2-85g-128m-200w-100-00...

+1
+2
-1
Je komentář přínosný?

>V některých případech modely s nižším počtem jader dosahují mírně vyššího nebo podobného výkonu jako modely s nižším počtem jader.
Nemá tam být jednou nižší a jednou vyšší?

+1
+2
-1
Je komentář přínosný?

Šlo by zde "B" používat pro byte a malé "b" pro bit jak je běžným zvykem?

Rychlost spojení mezi sockety 432Gb/s (54GB/s) by nebylo v roce 2022 ničím k chlubení.

+1
-3
-1
Je komentář přínosný?

dalsi co neumi cist.. ((:

'' Rychlost spojení mezi sockety 432Gb/s (54GB/s) by nebylo v roce 2022 ničím k chlubení. ''

jo? tak to asi nevis kolik ma intel.. ((:

+1
+2
-1
Je komentář přínosný?

Jde o to, že standardně se pro mezisocketovou komunikaci Epyc Genoa používá 64 linek (PCIe 5.0), což představuje teoretický datový tok 32Gb/s * 64 v jednom směru 2048Gb/s (256GB/s).

Údajně je možné toto variabilně při návrhu MB měnit (refereční MB to uměly dokonce uživatelsky za(vy)pojováním linků z důvodů ladění), takže se dá například prioritizovat podle cílového určení inter-socket komunikace před IO.

+1
+1
-1
Je komentář přínosný?

Ta indikovana prenosovka mi vychazi pro jeden link (1L), ktery tvori x16 PCIe port ale v mezisocketove komunikaci se to znaci jako xGMI. Jenze prakticke implementace pouzivaji ty linky 3 nebo 4, podle toho zda je potreba mit na 2S platforme 160 nebo 128 pcie linek.

Pak uz zustava jen otazka frekvenci.. ale slajdy ukazuji 32G serdes. Treba u Milanu to v rezimu xGMI jelo az na 18Gb/s (oproti 16Gb/s pro PCIe), ale ten koherentni protokol bude mit zrejme i vetsi overhead nez PCIe (a rozhodne tam budou litat packety s kratsimi daty, nez v pripade io zarizeni s dma).

+1
0
-1
Je komentář přínosný?

Tak už to konečně připomíná dobu, kdy jsme se bavili tím, kterak lze čtyřjádrem Intel drtit osmijádro AMD. Blbý pro Intel, že je to nyní naopak a navíc v serverovém segmentu. Tak ať jich AMD hlavně vyrábí dostatečné množství.

+1
+2
-1
Je komentář přínosný?

V podstate sme sa zasa dostali do pred-Nehalemovskej doby, kedy uz AMD ficalo na HT, ale Intel stale pouzival FSB a mal uplne smutne IO vysledky.

+1
+6
-1
Je komentář přínosný?

No, já nepamatuju dobu, kdy byl ve stejném segmentu konkurenční produkt Intelu 2,5× výkonnější než soudobý produkt AMD.

+1
+1
-1
Je komentář přínosný?

To ma Intel i dnes. Napr. 8-jadro 13900k ma 2,5x vyssi vykon nez 7700X ak ho pouzijes ako vyhrevne teleso.

+1
+1
-1
Je komentář přínosný?

Ale já zase i celkem jo. Co si tak matně vybavuju z doby porovnání 5960X a FX-9590 (cca konec 2014), tak tam šlo o zhruba 2,0× výkon ve prospěch Intelu. Než AMD uvedla první Ryzeny (3/2017) / Threadrippery (8/2017), tak Intel stihl ještě přidat dvě jádra a trochu to poladit do podoby Broadwellu-E, tedy modelu 6950X (Q2/2016) - jasně, měl šílenou cenovku, ale tvrdit, že nikdy nebyla situace, kdy by Intel měl na trhu desktop CPU s 2,5× výkonem nejlepšího desktop CPU AMD, prostě nelze. A FX-9590 byla FAKT HRŮZA, vím to, měl jsem ho a nějakou (krátkou) dobu i provozoval a pak se ho rád zbavil.

+1
0
-1
Je komentář přínosný?

Predpokladám, že tie pomyslené nožnice serverového segmentu vs desktopovom/mobilného segmentu sa budú aj naďalej roztvárať nakoľko na rozdiel od desktopového a mobilného sektoru po zotrvačnosti všetkými tými všetkými Rocket Lakami a Comet Lakami a pod.začína žať svoje ovocie zmena paradigmy a jej pokračovanie kedy Intel s hybridnymi big.LITTLE processormi Alder Lake a najnovšie aj Raptor Lake posiela ponuku AMD v niektorých prípadoch niekoľko rokov naspäť k situácii s podielom na trhu z rokov 2018/19 !

A presný opak vidíme v serverovom segmente kde Intel nenaskočil na zmenu paradigmy vôbec a procesory len s veľkými jadrami nedokážu konkurovať AMD ruku v ruke so niekoľkonásobným oneskorením už dávno ohlásených produktov.

Jednoducho ten 10nm Enhanced SuperFin (10++) alebo 10nm Enhanced SuperFin (10+++) alias "Intel 7 (Ultra)" sa oklamať voči nie to ešte 7nm TSMC a už ani nehovoriac 5nm TCMS nedá.

zdroj: https://www.3dcenter.org/news/die-marktanteile-fuer-x86-prozessoren-im-d...

+1
0
-1
Je komentář přínosný?

V serverech se setkáš v budoucnu pravděpodobně jen s P jádry, nebo jen s E jádry. Hybrid zejména u výpočetních clusteru postrádá smysl.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.