Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Skládání procesorů z křemíkových modulů snižuje AMD náklady o ~40 %

Obrázek uživatele MrSrsen

Podla mňa bolo skladanie CPU totálne geniálny nápad a nechápem prečo sa to nerobí už dávno keď to dokonca prináša tak skvelú flexibilitu.

+1
+8
-1
Je komentář přínosný?

Taky se to dělá už hodně dlouho, ale v trochu jiné oblasti trhu. Když si dáš vyhledat mainframe CPU, tak uvidíš, kam až to může zajít. Fakt hodně jader na obrovském cpu, ale jim tam jde kromě výkonu i o redundanci a navíc si tam můžou libovolně přidávat specializovaná jádra na urychlení provozu javy atd....
http://www.cpu-galaxy.at/cpu/white_beauties/white_beauties-Dateien/mcm16...

+1
+1
-1
Je komentář přínosný?

protoze NUMA, to je taky duvod proc je EPYC max dvou socketovy, protoze pak to je defakto NUMA s 8 uzly ... pro virtualizaci luxus, pro SQL ne az takovy ...
to samy slavny threadripper do desktopu, a mame zde kocko psa kde v biosu si nastavujes jaky mod vubec bude, proste pro specificke ulohy ano, ale rozhodne to neni samospasny reseni ...
to se me reseni a nove propojeni u skylake-sp libi vic pro skalovani do budoucna ...

+1
+1
-1
Je komentář přínosný?

cim je skylake lepsi? proti broadwellu orezali cache a zkriplili herni vykon, takze je to taky kompromis, jen jinej a hlavne mnohem drazsi..

+1
+10
-1
Je komentář přínosný?

ne vsici jsou hrama zivy a brecet u 28 jadra nad vykonem ve hrach ... a nova mesh sbernice musela prijit, nebo neco podobnyho, protoze jejich ring bus uz nestihal naveseni dalsich jader ...

+1
0
-1
Je komentář přínosný?

To tvrdí akorát Intel. U 24C Broadwellu byl ringbus naprosto OK, a u skylake by nebyl?

Mesh + novej cache systém je lepší jen v jedné věci a to jsou výrobní náklady. Ve všem ostatnim ala výkonu i efektivitě je horší. Proto je Skylake-X takovej shit na hry, L3 je malá a nejsou v ní data z L2, při požadavku na data z cache jiného jádra se tedy musí sahat až do RAM, + samotnej mesh běží na niššim taktu a cross core latence se citelně zhoršily, a herní IPC kleslo pod Haswell někjam k Ivymu. Prostě hrůza. Je to pravej opak toho co předtim mněly EP a EX Xeony který naopak i v hrách díky masivní L3 mněly na svůj takt hodně dobrej výkon.

Co se týče AMD tak jejich slepence jsou defakto multiCPU pod jednim package. Sw vývojáři nezvládaj multithread a teď po nich budeš chtít aby ještě k tomu dělali onen multithread numa aware s tim že musej počítat s neunifikovanejma blokama cache, RAM, atd? Výsledek je ten že to prostě využitý nebude, resp bude jen tam kde vůbec nejde o cache, ram, a každej thread je komplet nezávislej a vůbec nespolupracujou ala rendering stalu cinebench či mass virtualizace u serverů (ale ta taky neni vše, občas je potřeba výkon i jinde, databáze a tak). Všude jinde už to naráží na problémy se škálovánim teď. Mně se vůbec nelíbí kam to spěje. Pokud chce někdo velkej CPU s tunou jader co bude dobrej i v hrách tak jedině starší Haswell/Broadwell EP Xeon.

Tim nechci říci že by Ryzen/TR/Epyc nebo SK-X byly v hrách špatný, ale oproti 4C Skylake/Kaby nebo nedej bože 4C Broadwellu s L4 Edram jsou prostě slow s výrazně horšim IPC, což nikdy nebylo. Intel mněl vždy u těch větších CPU IPC stejné nebo vyšší jak u těch malejch.

+1
0
-1
Je komentář přínosný?

Neverim ze tie stare Xeony budu v hrach rychlejsie nez napr. 7980XE s pametami 8x8GB 3600-4000 (podla QVL Asusu by to malo fungovat) a mesh na ~3Ghz. 7980XE ma len minimalne nizsie frekvencie nez 7900X.

+1
0
-1
Je komentář přínosný?
Obrázek uživatele Tralalák

Vzasade by malo patrit ,,padni komu padni,, takze treba si dohladat co tvrdilo AMD v ere ked malo nativne monolity vs dvojadrove Pentum D Smithfield, stvorjadrove Core2 Quad na bazi MCM.

https://en.m.wikipedia.org/wiki/Pentium_D
http://diit.cz/clanek/test-ctyrjadroveho-procesoru-intel-core-2-extreme-...

Neskor naopak čo tvrdil Intel keď AMD malo dvanast (Magny-Cours) a sestnast jadra MCM Interlagos Opterony kompatibilními s platformou pre procesory AMD Opteron rady 6100 určené do socketu G34.

http://www.anandtech.com/show/2978/amd-s-12-core-magny-cours-opteron-617...
http://diit.cz/clanek/opterony-rady-6100-vyhled-do-budoucna

Potom este MCM boli napr. 40nm VIA QuadCore a 28nm Zhaoxin OctaCore.

https://www.viatech.com/en/silicon/processors/quadcore-e-series/
http://en.zhaoxin.com/ZXC.aspx?seriesid=13

Proste MCM je stary dobry ekonomicky osvedceny sposob pre nielen MultiCore procesory... ktory medzicasom dostal len marketinkovy pojem ,,MODUL,, s dobovou revoluciou zbernic FSB (V4 bus), HyperTransport k Infinity Fabric...

Padni komu padni...

P.S. este jedna poznamka ked sa porovnavaju velkosti die MCM (2, 4) s monolitickym jadrom bolo by z hladiska ich velkosti mat na mysli aj ich rozostupy die v celkovej velkosti package pretoze potom sa stava ze vznikne ,,Godzilovitý,, SSD-čko pripominajúci produkt procesora... a naklady HW infrastruktury tj. nie sú len samotne die, ale celok ako taký...

+1
+4
-1
Je komentář přínosný?

Vtedy AMD hovorllo "My vieme urobit monolit, Intel nie, a MCM je pomalsie ako monolit pre mdlzku spojov."

dajme tomu 3GHZ to je cas +/- 1/3 ns cca. 3x10^(-10)s s rychlost svetla vo vakuu je 3x10^8 m/s
teda za periodu CPU prejde svetlo vo vakuu (elektron v medi je zarucene pomalsi)
9x10^(-2) m teda cca. 9 cm. tazke medzi spolupracujucii dies v MCM je fazovy desinchron v datach. A to nebolo vtedy vyriesene, otazkou je , ako je to dnes.

Die v MCM je lacnejsi ako monolit o viac ako 40% vid nizsie

+1
-1
-1
Je komentář přínosný?

Co bylo, to bylo. Každý má právo kdykoliv změnit názor. Z chyb se poučili a nevracejí se k tomu, co je staré a špatné.

+1
0
-1
Je komentář přínosný?

Nemas na to softwarovou podporu, musim znovu opakovat, ze AMD bude zrat jak vino. :-) Jenze momentalne v domacim prostredi temer ten vicejadrovy pristup nevyuzijes. Porad jeste pro hodne cinnosti plati, ze co nejmene jader, co nejvice monolithu na co nejvyssi frekvenci. Uvidime, jestli se situace zacne menit s nastupem 8 jader do beznych pocitacu a skalovani vykonu na jednostliva jadra se zlepsi a hlavne kdy tak nastane.

+1
-5
-1
Je komentář přínosný?

kdo v domacim prostredi nevyuzije vice jader tak mu bohate staci neco na urovni pentia a nizsi :)

situace se uz davno zmenila aspon pro lidi co pocitac opravdu uzivaji castecne aktivne >>> kde porad zijete vy jste vedomostne a nazorove zamrzli nekde pred 10 lety a i v te dobe uz by to bylo sporne :)

+1
+4
-1
Je komentář přínosný?

Snazit se vysvetlit Redmarxovy, ze to je kokotina co rika je myslim nad lidske sily...
Staci vzit Firefox a otevrit v nem 20 tabu se zapnutym js a prehravat v tom flash...
spousta lidi uz pc ani nepotrebuje a presla na tablet a mobil..v tom pripade jim ani Redmarxuv 6ghz ST je k nicemu..

+1
+3
-1
Je komentář přínosný?

ono celkom zaujimave

> že v případě 32jádrového monolitu by stačila celková plocha 777 mm² (namísto stávajících 852 >mm²).

Treba si asi uvedomit inu vec

Samsung snížil chybovost 14nm procesu na 0,2 defektu na cm², mluví o 10 a 7 nm
http://diit.cz/clanek/samsung-snizil-chybovost-14nm-procesu

0,2 chyby na cm^2 to je 1 chyba na 5cm^2, čo je 500mm^2
Ak ma 32 jadra Zenu 777m^2, tak obsahuje v priemere 1,554 chyby na 32-jadrovy monolit. Kolko by bolo vyrobenych monolitov uplne bezchybnych? (chybovost rastie smerom k okraju a klesa smerom k stredu, ale pocet jadier, ktore sa zmestia na cast wafffera klesa smerom k stredu a rastie smerom k okraju)

plocha 200mm waffera je 251327 mm^2 to je 161 naraz vyrabanych 32 -jadrovych monolitov. Dva-tri z nich by boli bezchybne..

Zepelinov sa vyraba na 200 mm wafferi naraz 589 a chybovost je 0,426 chyby na Zepelin. Teda vdaka
skladaniu urobia z 200 mm waffera cca.. 84 bezchybnych 32 jadier. A pri cene Epyc vs Ryzen 3 je jasne, co chcu predavat..

+1
+1
-1
Je komentář přínosný?
Obrázek uživatele Jan Novák

Je to vždy o penězích. Pokud velikost čipu překročí nějaké rozumné rozměry a chybovost odstaví většinu čipů na desce, je pájení z více čipů jediná možnost. Otázka je, co udělá se spolehlivostí a rychlostí fakt, že se bude uvnitř procesoru pájet.

+1
0
-1
Je komentář přínosný?

Se spolehlivosti to moc neudela - tahle technologie nema zadny novy interposer ale je to obycejne pajeni cipu na desticku s vyvody, ktere se dela u kazdeho CPU (tech co maji jen 1 jadro). Je pravda, ze 4x vice bodu je mozna 4x vetsi sance selhani, ale oni to maj udelany tak aby to vydrzelo alespon zaruku :)

+1
+1
-1
Je komentář přínosný?

'' že se bude uvnitř procesoru pájet ''

wtf? (:

+1
+2
-1
Je komentář přínosný?

Dobrý den, mám takový dotaz.
V tomhle článku a i v jiných se píše, jak AMD vyrábí procesory nižších řad („V případě skládaného řešení ale v každém případě zůstanou 3 zcela funkční osmijádrové čipy a jeden, který lze v lepším případě použít jako šestijádrový, v horším jako čtyřjádrový a v nejhorším půjde na recyklaci.“).

Ale jak to dělá Intel oproti AMD?

+1
+1
-1
Je komentář přínosný?

Intel zdaleka tolik neskaluje, z polofunkcni i7/i5 muze udelat i3/Pentium (konec).

+1
+3
-1
Je komentář přínosný?

Takže to dělají stejně? Že z nevydařených procesorů vyšší třídy udělají procesory nižší.

+1
0
-1
Je komentář přínosný?

Presne tak, vid. nizsie..

+1
+1
-1
Je komentář přínosný?

To nevim, komentoval to Intel vubec nekde?

Ale tipl bych si, ze ano, jen proste maji jen dva stupne, zatimco AMD muze optimalizovat ucinneji diky tomu zpusobu, ktery pouzili.

+1
0
-1
Je komentář přínosný?

Tot sa robilo uz v minulom tisicroci (a to doslovne- Celrony, Durony mali len deaktiovovane casti s chybou). Vtedy a Intel dodnes robi CPU tak, ze vyraba najvacsi model a odpaja nefukcne castoi cacjhe, CPU, SMT logiky a pod a predava to na frekvencii, kde to za beznych podmienok funguje stabine. resp. degraduje mikrokodom/firmware CPU na take ake chce trh.

AMD ma stvorjadrovy CCX a dva vyraba naraz ako spojeny Zeppelin a ten sklada do vyssich CPU napr. 6 jadro su dva Zeppeliny, kazde s jednym chybnym jadrom, Stvorjadro su dva Zeppeliny, kazdy s dvoma chymbymi jadrami..

+1
+4
-1
Je komentář přínosný?

Díky za vysvětlení.

+1
0
-1
Je komentář přínosný?

nie je za co..

+1
0
-1
Je komentář přínosný?

Nejde jen o výtěžnost z křemíku, ale taky o výtěžnost při nalepování křemíkových modulů. Tady mi chybí informace jaká je ztrátovost/výtěžnost po nalepení modulů, protože to také není triviální operace. Pokud totiž selže pouzdření, zmaří se jak všechny moduly CPU tak substrát, takže neúspěch vyjde poměrně draho. U monolitu se mi jeví tato operace bezpečnější a spolehlivější.

+1
+1
-1
Je komentář přínosný?

Pouzdření chipu sice taky není nic jednoduchého, ve srovnání s výrobou chipů je to ale zvládnutá technologie. Rozměry drátků používaných pro připojení chipů ke kontaktům jsou o 3-4 řády větší než rozměry transiztorů na chipu ( 15-500um vs 14nm ) . Problémy způsobené špatným zapouzdření chipů se neprojeví hned, ale až po větším počtu vypnutí a zapnuti, resp tepelných cyklů. Takže tak za rok uvidíme, jaká bude reklamovanost Ryzenů a ThreadRipperů. Ideální je nechat komp furt zapnutý, tím minimalizujete teplené namáhání kontaktů.

Zajímavá prezentace k tématu : https://www.smta.org/chapters/files/Central-Texas_CTEA_8_12_2014.pdf

+1
0
-1
Je komentář přínosný?

Věřím, že v průběhu pouzdření se meziprodukty testují na chybovost.
Informace o "vyhodíme všechny cpu, když se pouzdření nezdaří" nemusí být 100%. Já bych si tipnul, že určitě existuje technika jak tato jádra zachraňovat, alespoň v některém kroku pouzdření.

+1
0
-1
Je komentář přínosný?

V článku není zmíněna ještě jedna výhoda malých jader.

Jestliže je wafer 200mm a 32monolit má cca 28x28mm tak se jich tam naskládá 28ks.
4jader s cca 14,5x14,5mm se tam vejde 120ks. To je 7% více jader.

+1
+1
-1
Je komentář přínosný?

A kde je ta vyhoda u Epycu? Preco je ten socket taky obrovsky? Skaluje to na 64 jadier?

+1
0
-1
Je komentář přínosný?

Protože 8 DDR4 kanálů a 64 PCI-E linek potřebuje HODNĚ pinů.. ;)

Škálování počtu jader nebude zas takový problém - stačí vyrobit větší die s např. 12 (16) namísto 8 jádry a získáme 48 (64) jádrový čip..

Mnohem větší problém by v takovém případě ale byla spotřeba a teplo.

+1
0
-1
Je komentář přínosný?

Skalovanie cez pocet jadier v die je druha vec. To trva nejaku dobu ako u Intelu. U Intelu po prechodu na mesh to bude mozno i jednoduchsie.

AMD fans boli celi nadseni ako ta architektura skaluje. Preto moja otazka. Kolko bude mat pinov 64 jadier? 8000 (2x Epyc)? Co potom 128 jadier? 16000 pinov? :-)

+1
0
-1
Je komentář přínosný?

A v cem ma byt problem, krome toho ze Vas bavi trolit...

+1
0
-1
Je komentář přínosný?

Myslíš, že trollí? Z jeho komentářů to na mě spíše působí jako absence znalosti základních principů.. Nechce se mi moc věřit, že by někdo psal takové hlouposti cíleně.. :/

+1
0
-1
Je komentář přínosný?

Namiesto vasich hluposti skuste citalelom vysvetlit kolko procesorovy (a jadrovy) system dokazete postavit s Epycom a kolko s Xeon Skylake-SP. Potom citatelom vysvetlite v com spociva ta flexibila riesenia od AMD oproti (monolitickemu, drahemu a nemodernemu..) rieseniu od Intelu pri danom maximalnom pocte jadier a vysvetlite preco je u AMD dany limit. Argumenty typu AMD by mohlo upravit die.. atd su nevalidne.

+1
0
-1
Je komentář přínosný?

Ja opravdu nerozumim tomu, v cem neustale vidite problem. Vyjma toho, ze ho sam tvorite.
AMD slo cestou skladanim nekolika CPU do jednoho pouzdra (se vsemi vyhodami a nevyhodami) a maji v tomto navrhu a tehle revizi limit na 32 jader podkladanych jako 4x8. Je to porad vice, nez nabizel Intel ve sve posledni generaci - 28 jader.
Socket nejspise odpovida tomu, co z neho potrebuji tahat, mozna tam je i nejaka rezerva pro budouci generaci..nevim, nestudoval jsem jej. Neni mi ani jasne, proc by to mel clovek pitvat.
Vyhody skladacky jsou myslim cekove oproti monolitu jasne a naopak taky.
Nevim co resite.

+1
0
-1
Je komentář přínosný?

Zřejmě mluvíme o něčem jiném - já mluvil o škálovatelnosti architektury/přístupu (tj. co může AMD dělat v budoucích projektech) a že není nezbytně nutné dělat větší socket (naopak tu nejspíš nějaké roky bude - AMD řeklo, že pro něj budou minimálně dvě další generace produktů), pokud nebudou chtít zvednout počet DDR kanálů či PCI-E linek.

Na současných platformách můžeme s AMD udělat 2x EPYC, tj. 64 jader, 64 PCI-E a 16 kanálů DDR4. S Intelem je (teoreticky - zatím jsem takové řešení neviděl) udělat až 8x Xeon Platinum, tj. 224 jader, v takových řešeních už jsou ale celkem brutální latence mezi jádry v jiných čipech (podle počtu skoků), kdežto u AMD je latence vcelku garantovaná (maximálně se jde přes 2 IF). Při takovém porovnání by si ale zákazník měl rozmyslet, kolik ho bude stát jedna 8socket mašina vs. čtyři 2socket od AMD (kde skončí s celkovým počtem jader na 256 a bude mít k dispozici více RAM). Jediný důvod proč nad tím uvažovat je nějaká úloha, která potřebuje hodně jader a zároveň musí běžet v rámci jednoho stroje (napadá tě nějaká?)..

Každopádně vícesocketové platformy jsou v zásadě to samé, co AMD přineslo na úroveň čipu a tedy vhodné/nevhodné na stejné úlohy (super na virtualizaci, nepříliš vhodné např. na DB systémy).

A jaká je výhoda AMD? V zásadě jen zásadně nižší výrobní a vývojové náklady - tj. jsou schopni nabídnout více, než Intel a za nižší cenu.. Pro zákazníky, co nemají neomezený rozpočet, je to velice lákavá nabídka ;)

+1
0
-1
Je komentář přínosný?

Co trvá nějakou dobu??

Celá současná architektura je perfektně škálovatelná - pokud by chtěli (a měli finance), můžou udělat monolitické 16core s 4 kanály jednoduše tak, že tam hodí 4 CCX..

Zvýšením počtu CCX na die by ale zbytečně přibyly další kanály (pokud máš 4 die s 2 CCX, máš už 8 kanálů, což je o třetinu více, než nabízí konkurence a těžko si lze představit potřebu více kanálů - a pokud je, tak si kup 2P server s EPYCem a budeš mít 16 kanálů DDR4), proto by mohli v některé další generaci navýšit počet jader bez výrazné úpravy tzv. uncore části, která je v Ryzenech velice silná a propustnost by dostačovala i pro více jader.

Takovouto úpravou by k žádnému navýšení počtu pinů NEDOŠLO. Co je na tom těžkého k pochopení?

Nejvíce pinů je věnováno DDR kanálům, PCI-E linkám a pak také napájení.. Pokud toto nezměníš, nepotřebuješ více pinů..

+1
0
-1
Je komentář přínosný?

Unified memory controller a IO hub su u Ryzenu s CCX spojene infinity fabricom. Zvysenie poctu CCX na die tak nevyzaduje dalsie pametove kanaly. Vas prispevok je chaoticky, nastudujte si architekturu Ryzenu a nepiste hluposti..

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.