Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k AMD Genoa-X a Bergamo v testech: Překonávají Genoa a válcují Sapphire Rapids

Jen tak dál!

+1
+3
-1
Je komentář přínosný?

Intel je vykonove o 2 generace architektury pozadu, to trh neakceptuje!

+1
0
-1
Je komentář přínosný?

Hosi z intelu dostavaji tedy fakt tezce na prdel :-O. Ale jsou to pasaci, co se hned tak neposerou. Tak Saphire Rapids nejspis nebude, jak pise no-x, pro intelske serverove procesory generaci posledni :-O, ale spis jen aktualne nejnovejsi ;-).

+1
+1
-1
Je komentář přínosný?

Teraz nech sa Intel pripraví lebo som presvedčený, že obrovská časť kontraktov pripadne AMD. AMD má konečne dostatok kapacít aby to všetko obslúžilo.

+1
+2
-1
Je komentář přínosný?

Ale naco. V inteli vyrobia nejaku peknu prezentaciu s krasnymi grafmi, kde server procaky AMD nebudu drtit intel 2-2,5 nasobne (a to este k tomu so spotrebou o 30% nizsou), ale dokonca tie intelovske budu o 10% rychlejsie. Intel ma s takymito materialmi bohate skusenosti.

Pamataj na slova byvaleho intel CEO: nepozerajte na benchmarky, zazite ten pocit.

Intel, vas technoligicky lider, od 2017 permanentne v srackach.

P.S.
* boli to casy ked monolity z ktorych sa vyrabali hign-endove 20-22-24-26-28-jadrove xeony boli pre AMD nedosiahnutelne vysiny, dnes sa tomu vyrovna "desktopovy" 16C32T R9 7950X3D
* boli to casy ked monolity z ktorych sa vyrabali 12-14-16-18-jadrove HEDT i9 boli u Intelu high-end pre HEDT a dnes sa tomu vyrovna "desktopovy" 12C24T R9 7900 65W

+1
+4
-1
Je komentář přínosný?

"nečekal jsem, že Zen 4C přinese takové zlepšení energetické účinnosti a zároveň bude tak výkonný."
Lepší výkon je důsledek lepší účinnost. CPU díky ní běží na vyšších taktech. V MT se pak projeví více jader. (Phoronix testuje pod Linuxem, takže do toho nekecá M$ scheduler)
Ale kde se bere ta efektivita?
Tranzistory jsou blíž u sebe => kratší spoje mají menší ztráty odporem.
Ale o tolik?

+1
0
-1
Je komentář přínosný?

Efektivita se bere v tom prostoru 2 az 3 GHz, coz jsou konzervativni takty. Cokoliv nad 3 GHz pak leti efektivitou mimo - proste to zere znatelne vice, nez to prinasi realny narust vykonu.

A malym dilem prispiva taky jednodussi jadro - tj. zde je to podobny pripad, kdy soucasna velka jadra pridavali nasobne vice kremiku a tranzistoru, pro dosazeni absolutne nejvyssiho vykonu - ale kdyz se udela kompromis a cili se na jadro s mensim vykonem, lze ho udelat s omnoho mensim kremikem nez o kolik vykon klesne. a mene tranzistoru = mene promarneneho protopeneho vykonu. (pokud tenhle princip budes aplikovat dale a dale.. dostanes se vlastne na to, co jsou GPU jadra - a tech jsou uz tisice, ve stejnem package TDP)

+1
+4
-1
Je komentář přínosný?

Úspora je ve 4c jen poloviční cache, jinak je zapojení tranzistorů totožné. Úspora místa je vypuštěním chladicícho křemíku, poloviny cache a propojek na 3D cache. Úspora tepla je nižšími kmitočty (kmitočty velkých jader v Epycech beztak nejsou bůhvíjak vysoké, když se mají vejít do 350W).

+1
0
-1
Je komentář přínosný?

AMD uvádělo přímo tranzistory navíc podporující vyšší takty. Ale možná to byla chyba překladu.

+1
0
-1
Je komentář přínosný?

Chyba překladu to opravdu není.
Některé "linky" jsou vícecestné. Rychleji se provalí ta vlna překlápění logických stavů.
A pak taky jsou tranzistory, které mají některé části ve více "kusech". Typicky 1, 2 nebo i 3 hradlové tranzistory. Ale víckrát může být i emitor nebo kolektor.

+1
0
-1
Je komentář přínosný?

To mi vysvětlovat nemusíte. Já reagoval na: "Úspora je ve 4c jen poloviční cache, jinak je zapojení tranzistorů totožné" Ta jádra jsou totožná funkčně - mají stejné IPC, ale nejsou schopna dosáhnout stejných taktů. Tedy nejsou stejná.

+1
0
-1
Je komentář přínosný?

Ja bych rekl ze tam bude rozdil i v reorder queue - poctu rozdelanych instrukci, takze to uplne stejne IPC nebude mit.

+1
-1
-1
Je komentář přínosný?

Podle AMD jen maximální frekvence a poloviční L3 cache na jádro, to jsou jediné rozdíly. Ostatně byli by sami proti sobě, kdyby dělali další změny k nižšímu IPC.

+1
+1
-1
Je komentář přínosný?

Mas pravdu, nuz.. jsem zvedav. Treba v kompaktizaci usetrili nejake duplicitni elementy, ktere by umoznili vyssi frekvence (analogie k ne-normalnimu SQL schematu). Nejaky zdroj, pro dalsi koumaly:

https://www.techpowerup.com/310057/amd-zen-4c-not-an-e-core-35-smaller-t...

+1
+1
-1
Je komentář přínosný?

V F. řadě jdou i přes 4 GHz (přesněji až 4,3 GHz v turbo režimu) ale zajímavější je all-core turbo:
AMD EPYC™ 9474F - 48 jader - all core 3,95 GHz
AMD EPYC™ 9374F - 32 jader - all core 4.1GHz

+1
0
-1
Je komentář přínosný?

Cache nema moc vliv na spotrebu jadra.. je to jenom chytrejsi ramka.

+1
0
-1
Je komentář přínosný?

Na spotřebu má větší vliv počet tranzistorů v logické části společně s taktem. Ale menší L3 má vliv na plochu, proto dostali na chiplet víc jader. 128 jádro má menší počet chipletů než 96 jádro. Místo 12 jen 8 o něco větších.

+1
0
-1
Je komentář přínosný?

Kolik bodů by měl 7950x, x3d a 13900ks?

+1
0
-1
Je komentář přínosný?

Genoa je 96 jaderna, Bergamo 128 jaderne, to chces skutecne porovnavat 16 a 8 jaderny procesor navic s malou cache? K cemu???

+1
-1
-1
Je komentář přínosný?

Zajímá mě to... Tak třeba R9 7950X3D má 144MB Cache, jede na vyšších taktech - 5.7GHz, má 32 threadů, Intel® Xeon® Platinum 8380 Processor má 80 threadů na turbo 3.4GHz s 60MB cache a jen DDR4-3200... proč by to nešlo porovnat? Třeba kolem 1000 v tom prvním srovnání by mohl dát, ne? Já při stavbě workstationy právě porovnával i serverové procesory... nakonec mám ten 950x3d a 192GB RAM, aktuálně na 5200MHz, po nové Agese podle mě dám i 6000, ne-li víc...

+1
+1
-1
Je komentář přínosný?

Ty výsledky v grafech jsou z 2P(dva procesory) konfigurací tj. z 192coreZen4 a 256core Zen4c. Takže 16c(32t) byť podstatně výše taktován by na score 1000 asi zdaleka nedosáhl. U 7950X3D jde o méně než dvanáctinu(šestnáctinu) jader na cca dvojnásobné frekvenci, takže MT score bych očekával někdo okolo 1/6 tj. 300. Paměťová průchodnost 24x 3200 versus 2x 6400 také na cca 1/6. Vzhledem k podobnému výsledku 9654 a 9684X (oba 96c) v sadě těchto benchmarků neměla vetší L3-cache znatelný přínos.

+1
0
-1
Je komentář přínosný?

Pozor propustnost není 24x3200 ale 24x4800 - ZEN4 má DDR5 ECC. Ostatně Ryzeny 7xxx taky mají oficiálně 5200 MHz RAM, vše výše je přetaktováno i když s požehnáním AMD.

+1
0
-1
Je komentář přínosný?

Pravda, díky za opravu. Podíl teoretické paměťové průchodnosti zmiňovaných platforem to ještě o půlku zvětší (na 1/9).

Jelikož je pro mne předvybraná Genoa finačně nedostupnou uvažuji stále přízemně v intencích maxima u Milana (3200MHz 1DPC, 2933MHz 2DPC). ;-)

+1
0
-1
Je komentář přínosný?

To mne napadlo. Jsem zvědavý, jak na tom budou ThreadRippery. I dost 1s desek místo 12 kanálů umí jen 8. Samozřejmě s jedním modulem. Protože těch 24 slotů zabere fakt mraky místa. A 48 pro 2s jsem taky neviděl. Chtělo by to nový formát RAM spoň pro Epyc ThreadRipper Pro tedy místo 2x32b, spíš 8x32 bitů. A nebo 4x64 b. Tím by se na desce ušetřilo spoustu místa.

+1
-1
-1
Je komentář přínosný?

To nemusí být problém pokud non-Pro Thr zůstane možnost unbuffered DDR5 a OC, byť netušíme kam paměti s takty pustí IOdie. Stejně bude asi limitujícím faktorem rychlost propojení GMI3 chiplet s IOdie, i v dvoukanálovém propojení (u čtyř chipletů) to snad u Genoa nepřevyšuje výrazně 100GB/s na chiplet. Teoretická průchopnost 450GB/s(12ch@4800) by tak byla podmíněna značně rovnoměrnou saturací bandwidth/chiplet.
https://www.servethehome.com/wp-content/uploads/2022/11/AMD-EPYC-9004-Ge...

Na případném TRX40 nástupci mi vadí těch údajných 64 PCIe linek, z Thr 1950X/X399 vím jak je to málo.

+1
0
-1
Je komentář přínosný?

Osobně si myslím, že těch 2x12 kanálů je pro 2s optimum ve chvíli, kdy je třeba přistupovat v k části RAN, právě přes druhou patici, že tam by 2x8 nestačilo. Ale pro jednopaticovou konfiguraci 8 kanálů nemusí být problém.

+1
0
-1
Je komentář přínosný?

Sockety jsou snad propojeny ekvivalentem 64x PCIe 5.0, což by mělo dávat cca 250GB/s v obou směrech. Chodit si pro více než půlku dat do cizího socketu se asi považuje za míru smůly, na kterou jsou dnešní 2S platformy krátké. ;-)

+1
0
-1
Je komentář přínosný?

Ve skutečnosti to u serverů může být i méně, protože některé desky v režimu 2S nemají 128 ale 160 PCIe linek... Ale do 2S pracovní stanice se mi to jako optimální nastavení moc nezdá.

+1
0
-1
Je komentář přínosný?

U takových diskusí si připadám jako na Živě před cca patnácti lety... prostě nikdo nikomu nenadává a zdravě se diskutuje... navíc jsem rád, že ještě někdo má takový knowledge. Díky chlapi!

+1
+2
-1
Je komentář přínosný?

AMD již déle umožňuje designerům u konkrétního MB toto definovat po blocích 16ti linek, tito tak mohou vyjít například vstříc potřebám aplikací stavícím na inter-procesorové komunikaci s "limitovaným IO" a zase naopak.
https://www.servethehome.com/why-amd-epyc-rome-2p-will-have-128-160-pcie...

2 Haunter:
Když se to přežene, tak si občas vykoledujete minus (a to i přes uvedení zdroje). Je to asi pro někoho snažší, než uváděné informace pochopit.

+1
+1
-1
Je komentář přínosný?

U generace 7003 jsem si toho všiml, kdy s tím začali, nevím.

+1
0
-1
Je komentář přínosný?

Ten článek ze STH je o Epyc Rome, takže to možná přišlo s centrálním IO die. V první generaci Epyců (Naples) si nevzpomínám, že by v případě 1S/2S zaznělo jiné číslo než 128 PCIe linek.
https://www.gigabyte.com/cz/Enterprise/Rack-Server/R181-Z90-rev-100#Over...

+1
0
-1
Je komentář přínosný?

Je to pravděpodobné. Vlastně je to chytré řešení, variabilní podle konkrétních potřeb.

+1
0
-1
Je komentář přínosný?

Lze dohledat porovnání Saphire Xeonů a 13900K v několika aplikacích.
Na věci od Adobe, Autodesk a některých jiných SW společností je lepší vysokotaktované JEDNO jádro.

Na serverové věci jsou lepší CPU určené pro servery.
A jak ukazují testy, druhú zátěže je více a tak najde uplatnění více verzí serverových CPU.

+1
+1
-1
Je komentář přínosný?

Ale 5,7 GHz je turbo pro jeden CPU chiplet - ten zrovna 3D cache nemá. Ten s navýšenou L3 má maximum 5 GHz.

+1
0
-1
Je komentář přínosný?

V all-core zátěži (což asi bude zmíněná sada benchmarků) stejně půjde o trvale dosažitelné all-core takty a ty budou u 7950X3D v průměru přes všechna jádra podle účinnosti chlazení někde okolo 5GHz. Base takty u mnohojádrových Epyců jsou třeba 2,5GHz, proto jsem dříve ve srovnání zmiňoval "dvojnásobné takty". Z mé zkušenosti s Epycy se v all-core zátěži takty pohybují o dost výše než jsou base-takty (možná na ty dojde až u opravdu drakonické zátěže AVX-512 atpd.).

+1
0
-1
Je komentář přínosný?

U běžných Epiců zaměřených na efektivitu ano. Ale ty s větším výkonem na jádro se drží přes 3 GHz.

+1
0
-1
Je komentář přínosný?

To určitě, ono unapájet 16c/24c a 64c/96c/128c není jiná liga, to je uplně jiný sport. ;-)

+1
0
-1
Je komentář přínosný?

To ano a ty F modely, co mají nejvyšší takty, končí na 48 jádrech maximálně. I tak je schopen AMD EPYC™ 9474F držet turbo 3,95 GHz na všech 48. jádrech. Slušný výkon, řekl bych na standard 360 W.

+1
0
-1
Je komentář přínosný?

Epyc 9124 má max. boost clock 3,7GHz a all-core boost 3,6GHz, v kombinaci s 64MB L3 cache (16MB/chiplet) z tohoto kouká obchodní segmentace, aby se udržel odstup od eFek. Při TDP 200-240W obálce snad nemůže být die co by to nesplňovalo (min. 4 funkční core a funkční polovina cache), bude to pravděpodobně z předposledního binu (po něm je patrně již jen trashbin).
https://www.amd.com/en/products/cpu/amd-epyc-9124

U jednoho prodejce je nyní nejprodávanějším z Epyců 24c 9274F, asi se na něj koncentruje zájem těch s licence/core položkou v TCO.

+1
0
-1
Je komentář přínosný?

Tomu bych věřil.

+1
0
-1
Je komentář přínosný?

Ani ne, to mate 200W desktop vs 400W server. Tim ze socket je 2x vetsi plochou, je to to same jen sirsi.

+1
0
-1
Je komentář přínosný?

Ale ještě i 32 core Epyc se vleze do 210 W. Ta efektivita tam vyšší je.

+1
0
-1
Je komentář přínosný?

Neni, je to jen o taktech. 32C epyc bude mit nizsi takty nez 210W 16C ryzen

+1
0
-1
Je komentář přínosný?

To nikdo nezpochybňuje, jde o to kolik GHz.core na Watt vám dané CPU poskytne.

+1
0
-1
Je komentář přínosný?

Tak nejlepe jsou na tom 64c/128t modely.. protoze ten pausalni cucak jmenem iodie se rozdeli na vicero casti a nema takovej vliv v celku. To da rozum. Pokud vyloucite vliv iodie, tak efektivita jader je stejna.

+1
0
-1
Je komentář přínosný?

Ten rozdíl efektivity bude holt výsledkem všech faktorů biningu, provozu na nižších taktech(nižší nap. napětí), menšího význam podílu TDP IOdie.

+1
+1
-1
Je komentář přínosný?

To přece nikdo nerozporuje. Ale takt se drží víc v efektivním pásmu. Takže celkový vícevláknový výkon na watt bude lepší.

+1
0
-1
Je komentář přínosný?

Vzato přes base takty 32x2,7GHz@210W a 96x2,4@360W je docela rozdíl (2,4W/GHz.core vůči 1,5W/GHz.core).

+1
+1
-1
Je komentář přínosný?

Mam nekolik Epycu ke hrani a zadnej nema TDP na base taktech.. bud to dosahuje nejake allcore turbo pro papirove TDP, anebo to zere mene, kdyz to zalimituji na "base freq". (Gen2 hlavne, ale i Gen1)

(ale moje testy jsou int only - kompilace kodu, zadne fp v avx)

+1
0
-1
Je komentář přínosný?

Ale pod ty base takty by to snad nemělo poklesnout ani při té nejhorší zátěži. Proto se výpočet efektivity upíná k nim, pokud budou výsledné takty vyšší tím lépe.

U Intelu údajně base takty platí pro non-AVX-512 zátěž.

+1
+1
-1
Je komentář přínosný?

Je otázka, nikde jsem to neviděl uvedeno, za jakých podmínek all core turbo platí. Reálně to bude někde mezi base a all core asi. A sem tam si to sáhne na max boost.

+1
0
-1
Je komentář přínosný?

To je definováno z jejich strany velmi přesně. ;-)

All-core boost for AMD EPYC processors is the average frequency of all processor cores running in performance mode while utilizing a low activity workload. Actual achievable allcore boost will vary based on hardware, software, workloads and other conditions.

+1
0
-1
Je komentář přínosný?

Teď jsem to jinde napsal česky.

+1
0
-1
Je komentář přínosný?

Oprava all core platí při aktivním Power režimu tedy ne při základním TDP a lehké zátěži. A je definována jako průměrný takt na všech jádrech

+1
0
-1
Je komentář přínosný?

Tyhle nový procesory jsou prostě parádní.. Místo plný serverovny řvoucího železa v menší firmě, v racku skoro pusto, jen totok, datový pole, switche a bižuterie.. Taky si zařve, ale klimatizace může hned na poloviční výkon.
Supervizor a virtuály v jedný mašině .. Dřív aby na každý prd byla mašina zvlášť...
Virtuály se moc prima zálohujou plus snapshoty.. spousta síťové kumunikace přímo mezi virtuály přes virtuální rozhraní.. ušetšíš rovnou na zrcadlový záložní systém někde opodál..
Vývoj nezastavíš.. pár desítek tisíc USD a co to udělá..

+1
+4
-1
Je komentář přínosný?

Ono je celkem skoda ze to porad rvou do dense aplikaci (2U resp 1U). Kdyby s tim prisli v 4U tak to nemusi tolik rvat.. jen ten vymennik na chladici bude vazit o neco vice. Holt je videt ze usetrit gram medi je dulezitejsi, nez usetrit penezenku uzivatele (ty turbo vetraky zerou dost velkej podil vuci TDP - treba u 1U CL3100 Gen10 (8x 45mm vetrak) jsem nameril 100W vuci 130W cpu :D

+1
0
-1
Je komentář přínosný?

To co je nad 320 W na patici už má smysl chladit jen vodou. Barebone s deskou, skříní a právě vodním chlazením už se celkem prodává.

+1
0
-1
Je komentář přínosný?

Nebo olejem jako ve Wedosu :-D Jinak já chladím 420 AiO i 7950x3d :-D Je prostě ticho.

+1
+1
-1
Je komentář přínosný?

U vody je ideál použít to na vše, co má větší spotřebu, takže minimálně grafika si to taky zaslouží. Na té nejvyšší úrovni to jsou procesory a akcelerátory v superpočítačích a stejná technika se posunuje do lepších serverů.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.