Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Atomový Xeon Sierra Forest se 144 jádry tvoří jedna procesorová dlaždice

konečně, svatý grál Intelu , málá jádra dobývají svět :-b AMDDe končí LoL

+1
+6
-1
Je komentář přínosný?

vazeni, vyzera to na riadne divnu sracku:

a) pre stvoricu jadier L3 mensia ako L2? kto to kedy videl?

b) L2/L3 su dedikovane pre stvovicu jadier, ale pre vsetky jadra ziadna napr. 144-288 MiB L4 alebo nieco podobne a ked bude potrebne vlakna prehadzovat z jednej stvorice do druhej, AMEN TMA ! Takych stvoric je tam 144/4=36 !!!

AMD to ma aspon po osmiciach VELKYCH jadier (tu L3) a tych osmic jej aj v 96-jadrovom cpu 12 (slovom dvanast) a 128-jadrak zen4c ma az 16-jadrove chiplety (!!!) a teda tu L3 zdiela az sestnast jadier (sestnastice) a tych tam je iba 8
......... ale aby si 36 ks. 4jadrovych celkov (modulov) muselo prehadzovat obsah L2/L3 - to sa mi nejak nezda, bud to bude strasna sracka, alebo ma intel tajne vylepsenie

+1
+2
-1
Je komentář přínosný?

Nezáleží jen na cache, ale taky na topologii a šířce propojovací sběrnice. Když vezmu Fujitsu A64FX, tam je 48 ARM jader (s širokými vektory), ale tam je jen L1 a L2 cache, žádná L3, malé kapacity a uspořádání 4x12. Ale právě díky rychlé sběrnici a integrované HBM2E (žádná další RAM) s propustností 1 TB/s, je to rychlé CPU. Tak třeba si z toho nějak Intel vzal inspiraci. A nebo to fakt bude propadák...

+1
+1
-1
Je komentář přínosný?

chybné vložení

+1
0
-1
Je komentář přínosný?

Ten obsah L2/L3 sa neprehadzuje. Cache sa proste flushne (alebo sa nespravi ani to) a co bude treba, sa znova nacita z RAM. Tipujem, ze tym, ze tam tych jadier budu tri prdele a nebudu bezat na uplne silenych taktoch nebude zas tak velmi vadit latencia pamati a obrovske cache nie su az tak velmi potrebne (resp. dalsie zvacsovanie kapacity flash prinesie iba zlomok zvysenia vykonu).

+1
0
-1
Je komentář přínosný?

Fujitsu uvádí toto:
L1I Cache Size 3MiB (64KiB /core )
L1D Cache Size 3MiB (64KiB /core)
L2 Cache Size 32MiB (8MiB x 4)
Což 32 MB na 48 jader je dost málo.

+1
0
-1
Je komentář přínosný?

Ale každé jádro má 4x ALU + 4x 256bit vektor+matice a umí FMA ve čtyřech operandech tedy AxB+C=D. A 1024 GB/s 32 GB HBM2, tedy 21,33 GB/s na jádro. A proto mu ta malá cache stačí. Takt nejvyšší verze 2,2 GHz při TDP 150 W.

+1
0
-1
Je komentář přínosný?

FMA4 měly i CPU od AMD.
Ale někdo rozhodl, že se nevyplatím je tam mít. Takže aktuální Ryzeny mají už jen FMA3.

+1
0
-1
Je komentář přínosný?

Protože k čemu instrukce v CPU bez SW podpory. Musel by to podporovat taky Intel.

+1
+1
-1
Je komentář přínosný?

A není to málo, Antone Pavloviči? :D

+1
+3
-1
Je komentář přínosný?

To bude neuvěřitelná kráva, plocha větší víc než 36 velkých jader. Proti čipletovému řešení AMD naprostá ekonomická šílenost. Ten zákazník je buď blbec, že to za adekvátní cenu koupí nebo to Intel dotuje. V každém případě je to další důkaz nezdravého serverového trhu, který se uzdraví jen kvůli někomu mimo x86-64 svět.

+1
-3
-1
Je komentář přínosný?

Alesppoň to nebude trpět na side-chanel zranitelnosti z druhého vlákna HT.

+1
0
-1
Je komentář přínosný?

Intel mluví o 144 jádrech, ale zatím nevíme, jestli jich tam fyzicky nebude víc, aby byl prostor pro deaktivaci. Alespoň prozatím to vypadá, že Intel má větší problémy se spojováním dlaždic než s výrobou velkých kusů křemíku (viz transformace ze čtyř dlaždic Sapphire Rapids na dvě dlaždice Emerald Rapids i na úkor zvětšení plochy na bezprecedentní rozměry).

144 jader by znamenalo 36 quad-jader, ale fyzicky tam může být třeba síť 5 × 8 (40) quad-jader, z nichž minimálně čtyři budou vždy vypnutá.

+1
+2
-1
Je komentář přínosný?

Takto to dělá IBM u Power 9 i 10 procesorů, nikdy neprodá plně aktivní čip.

+1
0
-1
Je komentář přínosný?

Odhad té bezprecedentní plochy?

+1
0
-1
Je komentář přínosný?

ARM Ampere Altra 80 jader s 32 MB cache 128 PCIe lineh a 8 kanálů DDR4 má na 7 nm 573.75mm2 (22.5 x 25.5). Nemyslím že 144 jader Intel bude menší. Stačí takto?

+1
0
-1
Je komentář přínosný?

E-core Raptor Lake (2.57mm2) 10 nm Intel 7
x 144 = 370mm2.
Pokud to budou vyrábět na Intel 4 nebo TSMC 4/3 .. tak to bude o něco méně.

V porovnání s 600+ mm2 grafických čipů to extrém není.

+1
0
-1
Je komentář přínosný?

Ale to jsou jen jádra bez řadičů RAM a sběrnice. A ty se moc zmenšit nedají.

+1
0
-1
Je komentář přínosný?

Inu. Nedají.
Pokud je ten obrázek alespoň trochu napovídající, tak by bylo potřeba přičíst řadič(e) DDR a sběrnice na propojení s ostaními dlaždicemi.

3.1415 x by_woko = nějakých 30 mm2. Celkem 400mm2. Jako dlaždice pořád velké. Ale stále ne extrém.

Vyrobitelné to je.
Ale pochybuji o ekonomické stránce. A to i přes ceny v serverovém prostředí.

+1
0
-1
Je komentář přínosný?

A když Ampere ohlásila rodinu One, kde je až 192 jader také jako monolit, jo to OK. Nechci a ani nestraním Intelu ale chci čisté hodnocení pro všechny.

+1
0
-1
Je komentář přínosný?

Ciplety maju vyznam vtedy, ak chce vyrobca usetrit tym, ze bude mat len jeden (resp. maly pocet) unifikovanych cipletov, ktore potom moze rozne kombinovat v puzdrach. Alebo v pripade ze sa oplati mat v puzdre ciplety roznej nanometraze, resp. od roznych fabov.
Ale v tomto pripade asi nema vyznam rezat to na ciplety. Maska ma zrejme len tu stvoricu, s poriadne hrubymi kontaktmi na okraji, aby sa posuvacia mechanika waferu trafila a osvetlovanie pre kazdu vrstvu bezi na 36 (resp. 40) krat. Nakoniec, Cerebras vie takto zaplnit cely wafer.

+1
0
-1
Je komentář přínosný?

AMD to dává jak variabilitu, tak možnost vyrobit 96 plných velkých jader v patici a nebo 128 velkých jader s menší cache. Ale do budoucna ten poměr bude asi větší ve prospěch těch malých.

+1
0
-1
Je komentář přínosný?

Nějaké indicie, kdo by mohl být ten "významný zákazník"?
Jen přemýšlím nahlas kdo by mohl mít takovou páku na Intel. Skoro pravděpodobnější mi přijde, že se Intel lekl vlastních slibů, a řekl si: tak to svalíme na nenjmenovaného "významného zákazníka". Prostě: "My jsme chtěli, ale naši zákazníci jsou u nás na prvním místě"

+1
+2
-1
Je komentář přínosný?

Tipuju HP nebo Dell...

+1
+2
-1
Je komentář přínosný?

Může to být klidně vládní (vojenská) zakázka, nebo i jiná ne přímo vládní významná instituce v USA. Pak je to taková spíše "karlovarská losovačka", respektiva patriotická podpora domácí firmy. Jenže v mezích nějaké udržitelné tolerance zpoždění a zaostalosti řešení...
Fabuluji, klidně to může být nějaká spřátelenost zúčastněných, nebo tak tak něco. Ale míra přestřelení nesmí být zase úplně mimo mísu. :)

+1
-1
-1
Je komentář přínosný?

Byl to Facebook. Je to uvedeno v jednom z jeho dalsich videii.

+1
0
-1
Je komentář přínosný?

Hm, nieco sa mi mari, ze Facebook si robil vlastne servery zalozene na ARMoch, ale mozno sa mylim.

+1
+1
-1
Je komentář přínosný?

Facebook byl i soucasti AMD vystoupeni na CES. Jestli maji vlastni ARMy nevim, ale pokud ano, tak to bude od typu serverovych uloh, kde maji co nasazene.

+1
0
-1
Je komentář přínosný?

Nejmenovaný zákazník je blb.
Měl si říct aspoň o 180 jader.
To by Intel složilo do kolen.

Použitelných jen 144 (a velice pravděpodobně pak i více) jader na dlaždici to je mazec, to musí být plachta jako prase i když to jsou jen E-core, zajímalo by mě kolik jader tam je fyzicky jako rezerva pro deaktivaci,
protože otázka není jestli se v dlaždici objeví chyba, ale kolik chyb bude v dlaždici, .....při tak velké ploše a dosavadním problémům s výtěžností.

+1
+3
-1
Je komentář přínosný?

To som ich podcenil, tipoval som 144 jadier na 4 dlaždiciach. :-) Sú to machri teda. Ak je výťažnosť uspokojivá, potom do desktopu môžu dať kľudne 72 jadrovú dlaždicu a úplne potopiť AMD s ich biednymi 16 jadierkami. :-) Ibaže je to Intel, 144 jadrová dlaždica je rozprávka a realita bude iná. :-)

+1
+2
-1
Je komentář přínosný?

Ještě nevíme, do kdy to je slíbeno. Intel stále vyhráno nemá.

+1
0
-1
Je komentář přínosný?

Tam bude i znizeny vykon, lebo E-cores v 12900k maju spotrebu 8W na jadro a tieto len 1,42-2,43W. 72 jadrovy atom so spotrebou 600W by mal vykon az 90k v Cinebench R23, ale s limitom 300W by mal cca 72k.

Na to by sice stacil i Ryzen 32-jadro ale na H2 2023 je uz naplanovany 32, 64 i 96-jadrovy Threadripper.

+1
0
-1
Je komentář přínosný?

Tady to je ale o jiném výkonu než o výpočtech v plovoucí řádové čárce. Právě proto se na takou práci hodí i ARM. A záleží i na výrobním procesu a cílených taktech. Tím Intel nijak nehájím, protože 128 jader ZEN 4 C na tom bude lépe.

+1
0
-1
Je komentář přínosný?

Znizeny ani byt nemusi. Toto skoro urcite nebude taktovane na 4,5GHz, ale vyrazne nizsie. Takze aj spotreba per-core moze byt v zatazi nizsia.

+1
0
-1
Je komentář přínosný?

U těchto bývají takty pod 3,5 GHz. Ať je to ARM nebo i ty AMD ZEN 4c. Nejde to výš.

+1
+2
-1
Je komentář přínosný?

Ja by som nebol prekvapeny ani ak by to slo pod 3GHz.

+1
0
-1
Je komentář přínosný?

Když srovnám TDP a nárůst taktů u čipu optimalizovaného na 3 GHz, je to brutální. Ukážu na ARM Ampere Altra 64 a 80 jádrech. 64 jader 2,2 GHz - 95 W / 2,6 - 125 / 3 - 180 a 3,3 GHz - 220 W. A ještě 80 jader 2,8 - 185 / 3 - 210 a 3,3 GHz - 250 W. Takže pro velké počty jader jsou takty nad 3 GHz jasně nevýhodné. U x86-64 které v desktopu jdou i přes 5 GHz to až tak drsně nevychází, ale i tak serverové EPYC s jádrem ZEN 4 nejdou ani v turbu pře 4,4 GHz - to drží jediný model navíc. 16. jádrový 9174F se základem 4,15 GHz, ale taky TDP 320 W. Což je na 16 jader fakt hodně. 128 jádrový 9754 má základ 2,25 a turbo pro jedno i všechna jádra 3,1 GHz a řekne si o 360 W.

+1
+1
-1
Je komentář přínosný?

U toho AMD EPYC™ 9754 tedy vychází 2,8 W na jádro. U Altry 1,48 až 3,44 W na jádro. Ale AMD má 2x širší vektorové jednotky, takže s efektivitou je na tom AMD velmi dobře. Navíc procesory AMD mají 1,5x širším paměťovou sběrnici a násobné kapacity L2 a L3 cache. Altra má na 32 až 80 jader 32 MB L2, a 96 a 128 jádrové modely dokonce jen 16 MB celkem.

+1
+2
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.