Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k AMD chystá Milan-X z vrstvených čipletů, leakeři ho prozradili dříve než Lisa Su

Bude sranda... Už když jsme koupili dva servery s EPYCy druhé generace byl ten rozdíl ve výkonu oproti 5 let starým Xeonům fakt propastný (a to se koupilo "jen" 2x 32C/64T s 1TB RAM). Tohle bude masakr i když to nemá 6xALU :-D

+1
+11
-1
Je komentář přínosný?

Nepřivolávat, já se jen děsím, kdy 6xALU, ASCII a pod čím vším sem lezl, si založí další účet a začne tu opět kálet do fóra ty bláboly.

+1
+14
-1
Je komentář přínosný?

"já se jen děsím, kdy 6xALU, ASCII a pod čím vším sem lezl, si založí další účet"

No tak já už nějakou dobu očekávám "nového" uživatele pod nickem Unicode. ;)

+1
0
-1
Je komentář přínosný?

Pche, navrství tam SVE-8192 a 12x ALU! :D

+1
+2
-1
Je komentář přínosný?

Nezapomen, ze AMD je vlastne pred krachem a Intel na půl cesty taky. Servery na bazi ARM jedou!
;)

+1
+14
-1
Je komentář přínosný?

A nejedou? Kolegova Altra je uz navic prekonana novou Altra Max se 128 jadry. To uz Epyc prekona o slusny kousek kdyz ho s 80 jadry srovnavala. Skoda ze mistni autori jsou moc zaslepeni a nepisi o zajimavych pocinech, pokud je prave nemohou schodit.

+1
-15
-1
Je komentář přínosný?

On je trochu problém v tom, že to jsou zatím "vybrané benchmarky".
Tydle nové architektury (viz např. test M1) většinou trpí tím, že mají oproti x86 nevyrovnaný výkon.
(Nebo jim možná sedne jiná zátěž, jak se to vezme - ale přecijenom je x86 určitej etalon).

+1
+16
-1
Je komentář přínosný?

Zas je tu ten Imbecil...

+1
+1
-1
Je komentář přínosný?

Vážně jedou? Z top 10 nejvýkonnějších superpočítačů je na ARM postaven jediný (a dostal se tam jen díky tomu, že má 3× tolik jader co nejvýkonnější ne-ARM systém). Kolik ohlášených exaFLOPS systémů bude postaveno na ARM? 1EFLOPS Aurora je x86 (Intel), 1,5EFLOPS Frontier je x86 (AMD), 2EFLOPS El Capitan je x86 (AMD) a na FP32 zaměřený 3EFLOPS HPC Mega-Project je rovněž x86.

Když výrobce pro prezentaci najde tři benchmarky, ve kterých jeho produkt dohání nebo překonává konkurenci, obvykle to znamená, že ve všech ostatních typech zátěže je situace opačná. To ostatně ukázaly testy Apple M1, který přes daleko vyšší počet tranzistorů a o generaci novější výrobní proces při podobném TDP sotva dotáhl x86:

https://diit.cz/clanek/apple-m1-v-passmark-dorovnava-rocket-lake-zen-3

Ve 3 testech lepší, v 7 horší a to při o ~27 % vyšším rozpočtu tranzistorů na procesorová jádra a o generaci lepším (5nm) výrobním procesu. Tolik k „zaslepenosti“.

+1
+16
-1
Je komentář přínosný?

Zase tranzistory. M1 je SoC ktere obsahuje vice nez jen CPU. Grafika, neural engine, security cip, akceleratory videa, image processing kamer a dalsi. Srovnavejme srovnatelne.

+1
-6
-1
Je komentář přínosný?

tak nechapem, ako sa mozes vytesovat z tych testov zverejnenych na anantechu(ohladom M1 vs x86 platforma). Porovnavaj porovnatelne, tj CPU vs CPU.

+1
+2
-1
Je komentář přínosný?

Jakým postupem jsi ve větě „…rozpočtu tranzistorů na procesorová jádra…“ našel grafiku, neural engine a akcelerátory videa?

+1
+7
-1
Je komentář přínosný?

Jirka tim nejspis myslel to, ze kdyz x86 jadro Zen3 (ciste jen 1C) ma treba 1milion tranzistoru, a celkove i s cache atp. ma Zen treba 50mil, kdezto treba M1 celkove ma 75mil, ale kdyz se odectou veci jako grafika, tak na to Arm jadro, ktere dotahuje Zen3 jadro vychazi treba jen 700tisic :-)

Alespon tak ja chapu jeho komentar.

Co si podle me ale Jirka neuvedomuje, ze zatimco to jadro Zenu zvladne vsechno, tak M1 to rozdeluje podle zateze na ty ruzne koprocesory a stejne ten Zen neda i kdyz ma na to dedikovane, specializovane obvody.

+1
0
-1
Je komentář přínosný?

Můj komentář je míněn tak, jak je napsán. Srovnávám pouze procesorová jádra bez všeho kolem. Každé velké procesorové jádro M1 stojí skoro 2× tolik tranzistorů co jádro Zen 3. Výkon tomu ale neodpovídá ani zdaleka.

https://diit.cz/clanek/x86-jadra-zen-3-jsou-proporcne-blizsi-malym-nez-v...

+1
+2
-1
Je komentář přínosný?

tu by som bol troska menej kriticky. Veci na sposob altry su imo v podobnej situacii ako bol epyc 2-3 roky dozadu. Ako jeden moze najst napr. na servethehome, phoronix, anandtech... vykonovo je na tom tento 80j arm velmi dobre. Niekde o nieco rychlejsi, niekde o nieco pomalsi ako 64j epyc druhej generacie. Pravdaze, 3-kovy epyc sa posunul vyssie, ale stale to nieje imo az taky vyrazny rozdiel, a este je mozne ze energeticka efektivita hra v prospech arm. Problem je imo ale ekosystem/dovera zakaznikov - tak isto ako to bol problem pre amd tie 2-4r dozadu, ked amd tiez mala fajn/super serverove cpu, ale trvalo to kym sa presadili.

Co chcem povedat - zatial to vyzera, ze arm produkty mozu zamiesat kartami v serverovom trhu. Je otazne v ktorych konkretnych oblastiach - ci sa na nich budu stavat najvykonnejsie superpocitace, alebo len "bezne" superpocitace a nejake datove centra, ale vyzeraju ze maju slusny potencial v oboch.

Problem vidim skorej v tom ze ekosystem umrie skor ako sa presadi - vid napr. kupa nvidiou, alebo nieco ine, napr. nerealisticky nizke predajne ceny altry na tak velke monoliticke cpu... Vykonu ako takeho by som sa az tak nebal - ten je slusny (nie zazracny ako niektori tvrdia) a konkurencieschopny.

+1
0
-1
Je komentář přínosný?

S tim se da souhlasit, co pisete. Jen s tim srovnanim s Epycy a "2-3 roky pozadu", je to podle mne trochu moc optimisticke. K vuli setrvacnost trhu plus AMD+Intel, to bude mit delsi rozjezd se prosadit mimo korporatni cloudove rybnicky typu Amazon..

+1
0
-1
Je komentář přínosný?

Altra Max jeste neni ani vubec venku. Je pouze ohlasena. Kdy bude fyzicky nekde 'tikat' vis?
Co si pamatuji, tak predchozi testy Altery, ktere delal Phronix ukazovali dobry vykon Altery, nicmene je dobre si povsimnout jedne veci, ze se testovalo 160C Altery vs 128C Zen2. Intel tam byl vicemene jen do poctu. Altera je rovnez monolit, takze se asi nebude prodavat za hubicku a asi by mne neprekvapilo, kdyby byl cenove mozna jeste drazsi nez Epycy.

+1
+5
-1
Je komentář přínosný?

Ale za cenu bezpečnostných chýb

M1RACLES: Apple M1 Exposed To Covert Channel Vulnerability
on 26 May 2021
https://www.phoronix.com/scan.php?page=news_item&px=Apple-M1-M1RACLES

+1
0
-1
Je komentář přínosný?

Tady nekdo psal o M1. O nove zranitelnosti Epycu tu taky neni ani čárka

+1
-3
-1
Je komentář přínosný?

Ale píšete tu o ARM výkonovo na úrovni x86 A to je len M1-ka

Ale keď chcete všeobecnú chybu v ARM máte ju mať - chyba v predpovedaní "GOTO 10"

Arm CPUs Hit By Straight Line Speculation Vulnerability, LLVM Adds Initial Mitigation
on 11 June 2020
https://www.phoronix.com/scan.php?page=news_item&px=Arm-Straight-Line-Sp...

+1
0
-1
Je komentář přínosný?

"ARM výkonovo na úrovni x86 A to je len M1-ka"

Podle toho, jaký x86 procesor. Surface s SQ1 je podstatně rychlejší než Surface Go například.

+1
-1
-1
Je komentář přínosný?

Ty vole Jirko, kdyz sakra nevis o cem mluvis, udelej si tu sluzbu, mrkni na google a za 7s budes chytrejsi.

"Ampere® Altra® Max in our labs and are excited to provide a preview."

Altra Max NIC NEPREKOVAVA, protoze jeste neni. Je to "upcoming" produkt. Co jsou zatim videt jsou jen odhady, simulace a specificke testy pochazejici primo z laboratori Ampere (takze to chce brat s rezervou).

Navic je to postavene na tom, ze to je o X procent lepsi, nez Altra, ktera byla znovu ve specifickych testech porovnavana se Zen2.

Je mozne, ze az to vyjde tak to bude lepsi nez Zen3? To samozrejme dost dobre mozne je. Ale je otazku jestli vsude, za jakou cenu, a kdy to vlastne bude.

Takze ze sebe nedelej saska a ty "zajimave pociny" posuzuj ve spravnem kontextu.

+1
+3
-1
Je komentář přínosný?

Jsme na tom podobně, zrovna řeším náhradu starších PowerEdge R620/R630 za R6525 s EPYCy 7302, v každém dva + 1TB RAM a to tak, aby každé CPU mělo osmikanál. Zatím je to pěkné, moc se mi líbí věci jako Broradcom quad-port SFP28 síťovka pověšená na šestnáct Gen4 linek a fakt, že VMware je u těch EPYCů ochotný používat i SMT.

+1
+1
-1
Je komentář přínosný?

Přesně tuto konfiguraci máme. Jsou super. Ale ta neochota DELLu mi to sem dodat (trvalo jim to než se vymáčkli aspoň tak půl roku). I když korporátní IT byli proti (jsem se jich neptal, prostě se to objednalo a hotovo), teď se docela diví :-)

+1
0
-1
Je komentář přínosný?

Zrovna nedávno jsme přemigrovali virtuálky z vCentra s Dell R620 s Xeony E5-2620 (2Ghz base clock) na vCetrum s Epycy 7F52 (3,5GHz base) a ten rozdíl nám vyrazil dech. Fakt jsme na to zírali "s otevřenou hubou". Ano, je tam ten rozdíl ve frekvencích, ale tipujem, že nejvíc rozdílu udělal ten mezigenerační skok Broadwell -> Zen2. Hlavně ty odezvy uvnitř ve virtuálkách, to je (řečeno slovy klasika): "Kam se hrabe Bittner, to se nedá srovnat."

+1
0
-1
Je komentář přínosný?

R620 a E5-2620 zní jako Sandy Bridge-E, rozhodně ne novější Broadwell-E, ten byl k mání jen v R630.

A není to jen o frekvenci, ale vyšší IPC, cache a rychlejší přístup do RAM, pokud máte dvě CPU, každé může mít osmikanál 3200 MT/s paměti, vs. ty starší Xeony, kde každý má max čtyřkanál s DDR3-1866 MT/s nebo i méně.

Ale taky mě překvapilo, že virtuálky bootují na Zen2 EPYCu rychleji, přestože to startuje přes FC ze stejného diskového pole. Podezřívám, že se hodně projevují ty bezpečnostní záplaty na Intel CPU co snižují výkon.

+1
0
-1
Je komentář přínosný?

Moje mýlka, hodil jsem "Xeon E5-2620" do Googlu a vyskočilo na mě, že je to Broadwell (nějak jsem přehlédl to v4, i když jsem si všimnul, že ta "base frequency 2,1GHz" neodpovídala).

Bootování nemohu posoudit, virtuálky zas tak často nerestartujem, ale "user experience" uvnitř virtuálek se fakt zlepšilo (jak už jsem psal). Jediné další co se změnilo, že ty nové virtualizační servery jsou mezi sebou nově propojené 25Gbps optikou (a tedy i virtuálky) - původní byly na 10Gbps. A je fakt, že "live migrace" je taky mnohem, mnohem rychlejší.

+1
0
-1
Je komentář přínosný?

já si myslím, že nejspíš půjde o nové IO die na 12nmLP+ od GloFo s podporou HBM ( jako odpověď na Sapphire Rapids )

"GlobalFoundries’ 12LP+ manufacturing technology builds upon the company’s 12LP process yet enables a 20% increase in performance (at the same power and complexity) or a 40% reduction in power requirements (at the same clocks and complexity) as well as a 15% improvement in logic area scaling when compared to 12LP platform. Among other things, 12LP+ supports 0.5V SRAM bit cells (which probably use IP that the company designed for its 7 nm nodes). In addition, GF developed a new 2.5D interposer that enables 12LP+ SoCs to work with HBM memory"

Vrstvené procesorové čiplety aka FOVEROS přijdou IMHO až později....

+1
0
-1
Je komentář přínosný?

Lasagne milanese... mňamka :)

+1
+3
-1
Je komentář přínosný?

Vrstveni procesorovych jader ani AI akceleratoru mi moc smysl nedava, protoze to je silne "aktivni" logika, ktera potrebuje dobre chladit. Vrstveni zvysuje energetickou "denzitu" pri stejne plose. Museli by to silne podtaktovavat (jeste vic nez jsou dnes serverove CPU podtaktovane), navic by tam musela extra logika aby se jadra nad sebou soucasne nejeli naplno, protoze to roztavi chip. Teoreticky by se to mohlo vyplatit, kdyby ty extra vrsty na logiku byli levne... ale prijde mi to nepravdepodobne. Ale uvidime. Spis bych tipoval obrovskou lokalni cache - neco jako 1-4G DDR-like pameti by se tam mohlo nacpat. Pomalejsi jako L3 ale porad rychlejsi nez externi DIMMky. V serverech na nektere workloady by to mohlo zvednout vykon o tech 10-20%.

+1
+3
-1
Je komentář přínosný?

„Vrstveni zvysuje energetickou "denzitu" pri stejne plose.“

Nikoli nutně. Počty jader se zvyšují a dále budou zvyšovat rychleji než TDP. Což znamená, že množství odpadního tepla na čiplet klesá. Především je množství odpadního tepla na jeden čiplet u serverových procesorů podstatně nižší než v desktopu a to i u stejné generace. Dva příklady:

1. V desktopu máme Ryzen 7 5800X, který při 105W TDP využívá jeden procesorový čiplet, který může konzumovat (15 W odečtěme na IO-die) cca 90 wattů.
2. V serverech máme Epyc 7713(P), který při 225W TDP využívá osm procesorových čipletů. Každý z nich může konzumovat (25 W odečtěme na IO-die) cca 25 wattů.

Pokud je možné z plochy jednoho čipletu odvést 90 wattů tepla, proč by měl být problém odvést 50 wattů při navrstvení dvou na sebe? A to prosím bez jakéhokoli podtaktování na straně serverového příkladu. Reálně by mohlo jít i o méně než 50 wattů na čiplet - pokud by touto cestou došlo k navýšení počtu jader, bude důsledkem ještě nižší spotřeba / čiplet.

+1
+4
-1
Je komentář přínosný?

navyše ak má AMD 2 patenty na chladenie vnútri čipu aj medzi vrstvami, pri vrstvených čipoch, Peltierom/TEC. Nehovoriac o tom, že podchladenie čipu pres štartom zníži spotrebu

+1
+1
-1
Je komentář přínosný?

Peltier má jednu drobnou nevýhodu. Čím víc chladí, tím víc topí.

+1
+2
-1
Je komentář přínosný?

Proto se na Peltier nasadí další! :D

+1
+2
-1
Je komentář přínosný?

nemusí. ak je teplým koniec držaný na izbovej teplote

+1
+1
-1
Je komentář přínosný?

lenže to chladenie má AMD vzriešené aspoň na úrovni patentu

AMD Files a Patent for Cooling of 3D Stacked Memory
by AleksandarK Jun 28th, 2019

AMD has filed a patent for cooling a 3D stacked memory with thermo-electric coolers - TECs, also known as Peltier devices. Being that TECs are made out of P-type and N-type semiconductors, they can easily be integrated into existing silicon manufacturing methods and controlled like a regular device. The process AMD has patented basically describes how to insert the TEC between memory and logic devices, where it draws heat from either logic or memory with each side being able to dissipate the heat
https://www.techpowerup.com/256902/amd-files-a-patent-for-cooling-of-3d-...

A je to už 2. genrácia TEC v čipe od AMD. Tá prvá bola na SOI. A vrstvené čiplety sa môžu správaním sa podobať na SOI..

65nm AMD procesory budou chlazeny Peltierem
26. 10. 2004

Firma AMD si nechala patentovat způsob chlazení procesorů integrovaným Peltierovým článkem. Hodlá jej využívat u procesorů vyráběných 65nm technologií, kde bude zásadním problémem právě chlazení
https://diit.cz/clanek/65nm-amd-procesory-budou-chlazeny-peltierem

+1
-2
-1
Je komentář přínosný?

A ktery cpu od AMD byl *doopravdy* takto vyveden, s integrovanym peltierem?

+1
-1
-1
Je komentář přínosný?

Zadny. Byl to vzdy jen "funky concept".

Ale Peter ma poruchu a funguje spis jako rozbitej vyhledavac, dokaze nalinkovat i absolutne nesmyslne veci dohromady. Nebrat vazne ;-)

+1
+3
-1
Je komentář přínosný?

A čo brán tomu, aby bol Milan-X prvým?

+1
0
-1
Je komentář přínosný?

Třeba tam budou jednotky GB HBM2 jako L4 cache :D

+1
0
-1
Je komentář přínosný?

A jak to asi budou chladit.

Hoax.

+1
-2
-1
Je komentář přínosný?

viď vyššie Majú patenty na chladenie každého SOI tranzistora Peltierom ako aj každej vrstvy HBM Peltierom

+1
-2
-1
Je komentář přínosný?

Peltierem to fakt chladit nebudou. Je to neefektivní, má to vysokou spotřebu a generuje to hromadu dalšího tepla, kterého se pak není jak zbavit.

+1
+1
-1
Je komentář přínosný?

Opět nuda v zatuchlém x86 rybníčku co je ze 3/4 tvořen bahnem. Kurvítka z toho stříkají na všechny strany.

https://www.anandtech.com/show/16693/arm-announces-mobile-armv9-cpu-micr...
Tak má vypadat vývoj.

+1
-5
-1
Je komentář přínosný?

Super... Ale ARMv9 NENÍ kompatibilní s ARM1, ale na každém moderním amd64 jádře jde v pohodě spustit 16-bitový OS (klidně MS-DOS 3.3) včetně VŠECH aplikací a to nativně bez emulátorů nebo různých berliček... To fakt není ono, že? Znám spousty průmyslových zařízení, které běží ještě na DOSu, OS/2 nebo Windows 3.11 (nebo dokonce i na BeOS). ARM možná tak na konzumaci obsahu, to je vše... Kdyby se x86 vykašlali na kompatibilitu, taky by šel vývoj daleko líp. Jenže na tom to stojí a padá.

+1
+1
-1
Je komentář přínosný?

Na dnes prodávaný HW je problém dostat i Windows 7 64 bit, takže význam nějakého MS-DOS je téměř nulový. Těm průmyslovým zařízením stačí 486, maximálně tak Pentium III - kvůli tomu se nemusí donekonečna prznit vývoj pro moderní HW/SW.
„ ARM možná tak na konzumaci obsahu, to je vše..."
Dobré zachrápnutí:).

+1
-4
-1
Je komentář přínosný?

Tu by som bol opatrný, keďže mám skúsenosť s tým, že skôr nejdú ako idú. Win 95 / 98 majú problém s pamäťou väčšou ako 512MB / 1GB , oboje majú problém s frekvenciou CPU vyššou ako 2,1GHz. Tieto (a ďalšie) problémy sa dajú pomocou "barličiek" obísť vďaka rloew-ovi - http://lonecrusader.x10host.com/rloew/rloew.html . Rovnako tak všetky DOS programy viazané na frekvenciu procesora bežia veľmi rýchlo a "division by zero" je veľmi častá chyba - pri Turbo Pascalových najmä. A to nepočítam problémy s DOS/4G(W), ale ten sa dá tiež nahradiť DOS/32. Takže, ide to, ale určite nie bez "barličiek". Väčšina problémov je spôsobená "zle napísaným" SW, ale moja pointa je, že na modernom HW je skutočne starý SW problém. Avšak nepopieram, že DOS nabootovať ide bez ničoho navyše. Aj keď už, radšej FreeDOS, ale tam sa stráca istá kompatibilita.

+1
+2
-1
Je komentář přínosný?

Jo jasné OK. Tak s těmi berličkami jsem to přehnal.

+1
0
-1
Je komentář přínosný?

Vývoj x86 je úplně v pohodě, po 5 letech si můžu za stejnou cenu koupit CPU, který má 1,5x single core výkon a 3x násobný multi core výkon.

Překotný vývoj ARMu ok, problém, že to nemá vůbec žádný nasazení kromě mobilů a sračkoidních androidích krabiček. Nemá to pořádný OS, drivery, nemá to aplikace, nemá to žádnou podporu ani u těch mobilů kde na to ani ne po roce sere pes. Pokud by kolem toho existovalo nějaký sw prostředí tak ten vývoj už překotný nebude.

+1
+2
-1
Je komentář přínosný?

Zkuste nekdy vygooglit co je to ten Linux zac ,) na ARMu bezi stejne dobre jako na x86/x64.
To, ze vy nemate moznost pustit ty ubohe windoze a par her na tom ARMu, neznamena, ze pro ne neexistuje dobrej OS :)

+1
-2
-1
Je komentář přínosný?

Na kterém ARMu konkrétně? :)

+1
0
-1
Je komentář přínosný?

chipletove lazagne? a jak to budu preboha chladit? teraz je jedna vrstva 2-4-8 chipletov na celej (v pripade serverov velkej) ploche PCB procaku, ked tam budu napr. 4 sendvicove vrstvy chipletov, jak to chcu chladit?

+1
-1
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.