Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Sapphire Rapids HEDT vytvoří dvě řady: 24jádrovou a 56jádrovou dual-socket

Dvojsocketove reseni s 8 ci 12 pametovymi kanaly (a ECC) prevalcuje desktopova 2ch vec bez ecc.. jiste jiste, to bude urcite tak a nijak jinak :))

+1
0
-1
Je komentář přínosný?

Tak jak v čem, že... A nemají náhodou DDR5 ECC automaticky?

+1
0
-1
Je komentář přínosný?

Mají, ale jenom takové polovičaté (resp omezené jenom na úroveň čipu)

+1
0
-1
Je komentář přínosný?

Kde konkrétně se taková informace dá ve článku najít?

+1
0
-1
Je komentář přínosný?

"Mainstreamové platformy pro standardní desktop jako Meteor Lake a Zen 5 jej ale „do roka a do dne“ nechutně převálcují."

Standardni desktop = 2 ch, non-ECC.

+1
-1
-1
Je komentář přínosný?

Co má výkon společného s ECC?

+1
0
-1
Je komentář přínosný?

Zadny desktop nema absolutni vykon vetsi nez slusne dvojsocketove serverove reseni byt o rok a generaci starsi. Nevim kde se bere ta naivita, ze takovy next-desktop bude skokove o 400% vykonnejsi nez byl predchozi, aby prekonal nabusenou 2S sestavu.

A ne, nemuzes porovnavat vykon na jadro, vykon za cenu, vykon za spotrebu - bavime se o celkovem absolutnim vykonu.

+1
0
-1
Je komentář přínosný?

Takže odpovědi na otázku jsem se nedočkal. Dobře, zkusím jinou. Kdo kde tvrdí, že desktop bude mezigeneračně o 400 % výkonnější, nebo že desktop překoná dvousocketové řešení?

+1
0
-1
Je komentář přínosný?

Už se těším, až AMD vydá jako odpověď dvousocketový Threadripper-pro. LOL.

BTW, Non-pro Threadripper už poměrně jistě nebude, AM5 podle všeho bude podporovat 32 PCIe linek (i když Raphael, jak se zdá, jich zatím bude schopen využít jen 28), takový Threadripper by neměl smysl.

+1
+2
-1
Je komentář přínosný?

Je si třeba uvědomit, že non-Pro Threadrippery měly 64 PCIe linek již v první generaci a samozřejmě že taková platforma smysl měla a má, za předpokladu, že by řada Thr 39x0X nezdražila vstup do ní skoro na trojnásobek (o proti X399/1(2)9x0).

+1
0
-1
Je komentář přínosný?

Pokud by se jim povedlo povysit Epyc az na 4S moznosti tak bychom se urcite dockali i 2S TR-pro.

Jinak ty nove TR-pro do sWRX8 jsou jenom preznacene 1S limited Epyc procesory. Vzdyt je to uplne to same.

+1
+1
-1
Je komentář přínosný?

Není to zcela totéž, stačí se podívat na takty. EPYC byly vždy níže taktovány.

+1
0
-1
Je komentář přínosný?

Ja prave pred mesici cetl ze novy 6nm centralni ciplet vyrabeny primo TSMC pro generaci Zen IV/Raphael, jiz umi obsluhovat/propojit ne 2 ale 3 ciplety, cili kdyz si vezmu 8 jader uvnitr kazdeho CCD plus planovane navyseni TDP u generace Zen IV na 170W, coz v pripade pouziti noveho 5nm(N5P) procesu TSMC nedava logicky smysl(jedine tehdy kdyby se AMD odhodlala na pouziti agresivnejsich taktu pres 5.5GHz), mi to pak vychazi na uvedeni 24 jadrovych modelu generace Zen IV, logika je to jasna, prima a prosta, non-Pro ThR uz jednoduse nebude a konkurenci(intel) v AMD bedlive sleduji, cili se nam na trh nabizi 24 jaderny Ryzen 7990X(7950X bude tradicne 16 jaderny).

+1
0
-1
Je komentář přínosný?

Moje křišťálová koule se přiklání k tomu, že 24C neuvedou - bude jim stačit 16C/32T a těch 170W bude kvůli těm zmíněným ~5,5GHz

+1
-1
-1
Je komentář přínosný?

Jednojádrový boost nesouvisí s TDP, neboť jeho výše není nikdy omezena TDP.

+1
0
-1
Je komentář přínosný?

Kde píšu o jednojádrovém boostu? A i kdyby to byl jenom jednojádrový, při 170W TDP se k tomu může blížit i ten "všejádrový" :-)

+1
0
-1
Je komentář přínosný?

5,5 GHz je predsa 1jadrová frekvencia.

+1
0
-1
Je komentář přínosný?

Pokud AMD dosáhne 5,5 GHz na jednom-dvou jádrech, bude to skoro zázrak a může si gratulovat. Současné vzorky Zen 4 mají mít jednojádrový boost kolem 5,2-5,3 GHz.

+1
0
-1
Je komentář přínosný?

No tak jasné ale to 170W TDP by sedělo na zvýšený vícejádrový boost. Nebo ne?

+1
0
-1
Je komentář přínosný?

170W může být třeba model s 16 jádry a 5GHz all-core boostem. Nebo ne :-)

+1
+2
-1
Je komentář přínosný?

Je to jen teoretická rezerva, navíc stále jen omezená konektivita - RAM kanály a PCIe.

+1
0
-1
Je komentář přínosný?

@autor Neměla by platforma Expert Workstation Platform mít zkratku EWP? V článku je u obou MWP což tak úplně nedává smysl.

+1
0
-1
Je komentář přínosný?

M jako mistake?

+1
0
-1
Je komentář přínosný?

Opraveno.

+1
0
-1
Je komentář přínosný?

doubleclick - smazat

+1
0
-1
Je komentář přínosný?

Hlavne treba cim skor poslat NUMA nezmysel na smetisko dejin.

+1
-2
-1
Je komentář přínosný?

NUMA není a nebyl nesmysl. Ve své době umožnil výkony, které by jinak nešly a nebo vyšly dráž.

+1
0
-1
Je komentář přínosný?

To nepopieram. Ma svoje miesto, rovnako ako CRT monitory, elektronkove pocitace a socialna demokracia.

+1
0
-1
Je komentář přínosný?

Do jistého počtu jader nebo fyzických patic je výhodnější než jiné typy propojení. Propojovat víc než jistý počet uzlů takovým systémem, aby jsme zde nešli pod minimální propustnost a nad maximální latenci a neshořeli na počtu spojení není až taková sranda.

+1
0
-1
Je komentář přínosný?

Ja chapem, preco sa to zaviedlo. Je to proste taky technologicky ojeb, ako ked na maticnej doske vyvedu 8 USB portov, ale vsetky su zapojene do jedneho hubu. Ako som pisal, ma urcite svoje miesto v dejinach vypoctovej techniky.

+1
0
-1
Je komentář přínosný?

Fakt by mne zajímalo proč ojeb. Třeba systém každý s každým ve stylu krychle pro 4 uzly nebo hyperkrychle pro 8 už je dost náročná na počet spojů, ale víc než 8 např 12 nebo 16 už je velký problém. Ring Bus to sice datově řeší, ale latence u více uzlů dost rostou, pak mimo Numa už zbývá jen kombinace krychle s ringem, pokud se to vůbec tak udělat dá. Ještě tu je mříž, ale to je realizovatelné a vyplatí se až nad řekněme 24 až 32 uzlů.

+1
0
-1
Je komentář přínosný?

"... 112 jádry / 224 vlákny Golden Cove a dosáhnout tím (opět vyčísleno použitím jednoduché matematiky) výkonu o 4 % vyššího..."
NE.
Jednoduchá matematika u dvousocketoveho řešení nikdy nefungovala.
Přidáním druhého CPU vzroste výkon cca o 80%.
Ale cena o 120%.
Základní deska, která pobere 2 CPU stojí víc než dva obyčejné MB. Na RAM se nic neušetří. Výkonnější zdroj je dražší. Case taky nejde použít ta nejlevnější.
Ekonomicky to smysl nemá.
V určitých situacích to smysl má.
Ale jen v serverech kde se platí za pronajatý prostor v racku a nebo potřebuje jedna aplikace hodně RAM a nejde rozdělit na víc serverů.
Pro WS aplikace se dva sockety nehodí.
Jo v časech jednojádrových CPU Pentium III to smysl mělo. Druhé jádro bylo hodně poznat na odezvě systému.
Ale třetí, čtvrté... už takový efekt nemá.
Tam je přínos jen v MT aplikacích.
A ty zase většinou umí běžet na více PC.
Například render.

Intel jistě najde jeden benchmark, který nenarazi na bottleneck a pojede jim to o 4% rychleji než AMD. Ale v praxi to nebude tak růžové.
A to nemluvím o tom že optimalizace pro 32 jader už začínají drhnout a 64 jader naplno využijí jen speciální úlohy. Ale to je věc výrobců SW. Jak rychle se adaptují na tyto monstrózní systémy o kterých je článek.

+1
+1
-1
Je komentář přínosný?

To ze vy nedelate v aplikacich, ktere potrebuji opravdu hodne pameti i jader (a tam se 2S system hodi), neznamena ze je to nesmysl. Vzdy to ma svoji cilovku, ale lidi co netusi jak by to vyuzili ji fakt nejsou.

+1
+1
-1
Je komentář přínosný?

Jo těch aplikací vhodných pro 2S je hodně. Ale jsou to spíš serverové aplikace. Uživatel pracující na WS taky narazí na situace že potřebuje MT výkon. Ale většinou to pošle do cloudu nebo na nějakou farmu.
Je to hloupí nápad na pracovním stroji čekat až se 64 jader prokouše úlohou kterou může dělat jiný stroj.
Ano cílovka nějaká bude, ale dost úzká.
Znáte alespoň jednu takovou aplikaci, kde by byl uživatel brzděn 64core a 256GB RAM?
Přiznávám že já ne. A když, tak nevyžaduje aby u ní seděl člověk.

+1
0
-1
Je komentář přínosný?

Zakaznik dela fotogrametrii - tj proces hledani 3D modelu ze sady fotek. Tech fotek jsou tisice, terabajty dat, takze se to resi rychlym NVMe a hromadou RAM, protoze cim vice jader, tim rychleji to skonci (ale taky potrebuje vice pameti). GPU zde prilis zapojeno neni, protoze data se hodne casto meni (jsou na jedno pouziti) a PCIe do GPU je uzke hrdlo.

Samozrejme by se dalo tohle resit v clusteru, ale pro nizky overhead by to vyzadovalo MPI/HPC fabric, nemluvne o tom, ze za licenci softu se nedoplatite.. takze se to snazi tady resit nejnadupanejsim WS :)

+1
+1
-1
Je komentář přínosný?

OK, díky za příklad. Jeden budiž uznán.
Fotogrametrii jsem zkoušel před 10 lety. Od Autodesku.
Zjistil jsem že pro dobrý vysledek těch fotek potřebujete fakt tisíce.
Vygenerování jednoducheho 3D modelu v nic moc kvalitě ze stovky fotek trvalo hodiny.
Fotky nemuseli být v super kvalitě, podstatnější byl jejich počet. A taky bylo fajn když šli hezky za sebou. Automatika je v té době neuměla moc dobře rovnat. Dnes to řeší dron s kamerou, který se proletí kolem.
Ale sám Autodesk nám v rámci balíku nabídl cloud. No v té době český internet nebyl na toto připravený. Odeslání bych musel nechat běžet celou noc.

Je otázkou času než si výrobci SW uvědomí že licence pro cluster je neprodejná díky corewar, kterou rozpoutala AMD.

Jak píšete GPU se neuplatní. WS si představuji jako stroj vybavený drahou grafikou s připojenými drahými monitory.
Je to plýtvání potenciálem na WS nechat běžet aplikaci, která toto nepotřebuje. Předpokládám že stavíte něco na míru pro toto použití. Základ je WS, ale z mého pohledu výsledek už není WS.
Pojmenoval bych to spíš "farma složená z jednoho 2S stroje." Ale to je jen můj omezený pohled.

Naposledy jsem na Fotogrametrii (3D scanner)narazil u zubařky. Jsem koukal jak rychlé (pár minut) a jednoduché bylo vytvoření 3D modelu (otisku) zubů. Mašina se sondou(kamerou) to v reálném čase moderovala přímo před očima na monitoru Takže bylo vidět kam se s kamerou třeba podívat aby model byl kompletní. Předpokládám že sonda/kamera měla v sobě giroskop, takže stroj věděl z kterého úhlu je fotka pořízená. Což značně urychluje výpočet až na realtime.

+1
0
-1
Je komentář přínosný?

Nejsem si jistý, zda těch uváděných 80 % pro druhý socket stále platí a zda to spíš neplatilo pro třetí a čtvrtý. Záleží na propojení, jak je rychlé a jaké má latence. U AMD to je na úrovni 64 linek rychlých jako PCIe 5.0. Což není právě málo, je otázka co si pro to připraví Intel. Ostat Intel i IBM mají i osmisocketové desky, asi ví, proč je dělají.

+1
+1
-1
Je komentář přínosný?

Vy to evidentně vidíte jen z pohledu svých zkušeností. IBM je v tomto tak daleko, že se vám to ani nezdálo. Včetně dálkového přístupu do RAM klidně na kilometry a dokonce i sdílené L2 cache mezi paticemi. Kdyby to nemělo smysl, asi to nebudou vyvíjet a topit v tom peníze.

+1
0
-1
Je komentář přínosný?

Ano o IBM stroje se nezajímám = nemám přehled.
Článek je o tom že Intel chce začít cpát 2S do HEDT neboli WorkStation. Z pohledu intelu dobrý nápad. Prodají dvojnásobek CPU. Ale je to řešení pro servery a není vhodné pro WS. To že CPU používá cache souseda je fajn.
Ale latence bude vždy horší než když zdvojnásobíte cache a použijete jeden CPU.
Za serverem nikdo nesedí a nečeká na odezvu systému.
Na rozdíl od WS kde je odezva systému klíčová.
I když se jim to povede a nenarazi na bottleneck (může být jinde než v propoji mezi CPU) tak výkon bude 100% ale cena 120%. Kdyby to dělali pro zdvojnásobeni výkonu jednoho stroje, tak OK, jeden uživatel se našel i mezi námi, co hledí na max výkon a nekouká na cenu. Ale dělají to jen pro to aby dohnali konkurenci. A tudy cesta nevede.

A to nemluvím o spotřebě. Cena elektřiny je u WS zanedbatelná.

+1
0
-1
Je komentář přínosný?

Na velmi jednoduchém příkladu lze dokázat, že dvě patice i u AMD umožňují dosáhnout konfigurace, na jakou se Threadripper Pro bez ohledu na peníze nemůže dostat.

AMD Ryzen Threadripper PRO 5995WX - 64 jader reálně mezi 2,7 a 4,5 GHz maximálně 8x 128 nebo 256 MB DDR 4 3200 a 256 MB L3. 280 W

Proti tomu 2x AMD EPYC 75F3 celkem tedy 64 jader reálně mezi 2,95 a 4,0 GHz maximálně 16x 128 nebo 256 MB DDR 4 3200 a 512 MB L3. Nastavitelné 450 až 560. Je jasné, že reálný takt v zátěži bude výše.

Obdobně můžeme mít více L3 cache: 2x AMD EPYC7573X celkem tedy 64 jader reálně mezi 2,8 a 3,6 GHz maximálně 16x 128 nebo 256 MB DDR 4 3200 a 1,5 GB L3. Nastavitelné 450 až 560. Je jasné, že reálný takt v zátěži bude výše protože těch až 280 W bude proti jednomu socketu vycházet na polovinu jader.

Takto se dá udělat 128 jader a podobně. I když budu zvažovat, že ve výsledku mám 180 - 185 % výkonu a ne 200 %, stále dvojnásobek L3 cache, dvojnásobek kapacity i propustnosti RAM. S ohledem na to, že část PCIe padne na vzájemnou komunikaci stále zde vychází 128 PCIe 4.0 linek na rozšáření.

+1
0
-1
Je komentář přínosný?

Nějak mi uniká pointa. Ale shodneme se na tomto:
Vzít dvě nejvýkonnější CPU (myšleno v MT) a nacpat je obě do jednoho stroje je dobrý nápad.
Posune to maximální možný výkon skoro na dvojnásobek.
Ale vzít dva mizerné CPU a udělat z nich jeden stroj? Jaký to má význam? Posunout maximum možného o 4% za cenu spousty kompromisů a brutální ceny.

+1
0
-1
Je komentář přínosný?

Pointa je v tom, že v jedné patici máme max 64 jader, ale k nim 8 kanálů RAM a max 280 W. Kdežto ve dvou paticích až 128 jader a nebo opět 64 ale na vyšším taktu (máme pro ně 560 W) a 16 kanálů RAM. A především a to tu nepadlo. ZEN 3 byl k dispozici v EPYC od začátku, kdežto na ThreadRipper jsme si museli počkat víc než rok. A jako bonus si dvou patic můžete vibrat víc variant TDP a L3 cache. Samozřejmě dráž při srovnatelné konfiguraci. Pointa je tedy v možnosti mít konfiguraci, kterou s jednou paticí neuděláte. A co vím, tak dvě patice by do budoucna pro ThreadRipper měly být možné jako reakce na dvoupaticové Intel workstation. Ale technicky desky které to s příslušnými Epyc umí existují už pár let. Oficiálně AMD Epyc má pro servery a ThreadRipper pro workstation, ale AMD Epyc workstation jde sestavit taky. Jsou i firmy, co to tak přímo prodávají.

+1
0
-1
Je komentář přínosný?

"....Zen 5, který má v socketu AM5..."
Nikde jsem to neviděl potvrzené přímo od AMD.
Předpokládám že to tak bude.
Ale jisté to není. Nebo mi něco uniklo a AMD potvrdila, že Zen 5 pojede v AM5 deskách, které se budou dát koupit letos?

+1
-2
-1
Je komentář přínosný?

Podpora více generací procesorů jedním socketem je pro AMD konkurenční výhodou, kterou bude zcela jistě chtít využít i v následujících letech. Dvě generace jsou minimum, počítejte alespoň tři.
Dál je to spíš o čipsetech.

+1
+2
-1
Je komentář přínosný?

„Nikde jsem to neviděl potvrzené přímo od AMD.“

https://diit.cz/clanek/amd-ocekavame-ze-socket-am5-vydrzi-4-5-let

+1
+1
-1
Je komentář přínosný?

Děkuji za odkaz.

+1
0
-1
Je komentář přínosný?
+1
+3
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.