Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k TSMC pro AMD vyvíjí 5nm proces na míru

Aj keby boli hodnoty polovicne, tak potesia.
T.j. +7% frekv alebo -15% spotreba.
To by sme tu mali uz konecne ten 5 GHz pre 1-vlaknovy boost (miesto dnesnych spiciek 4,6-4,7 GHz) alebo +7% vyssi vsejadrovy boost pri dnesnych spotrebach.
Alebo dnesne 105W modely (aj desktop spicka 16- a 12-jadrakov R9 3900X a 3950X) by sa razom pre dnesnych frekv zmenili z cedulky 105W TDP na 95W modely :)

a tie hustoty pre rozne druhy obvodov, no pekne ... nieco 20-30-50% a nieco 84%, v priemere mozno 50-60%, takze dnesne 7 nm 8C chiplety si mozme predstavit co do plochy ako 5nm 12C chiplety :)

+1
0
-1
Je komentář přínosný?

AMD už naznačovalo, že půjde cestou archit. změn. Tj. přidají více tranzistorů (ať už půjde o logiku, cache, další jádra...), než aby to hnali do frekvenčních výšin. Od určité frekvence jde ta spotřeba ukrutně nahoru (viz poslední Intely). Navíc jaký má význam dát si do specifikací "až 5,2 GHz", když to na té frekvenci jede jen chvíli (pár sekund). Lepší mít "jen" 4,6 GHz a delší dobu (pár minut).

+1
+4
-1
Je komentář přínosný?

1.84x větší hustota tranzistorů
1,30x nižší spotřeba při stejné frekvenci
…. z toho plyne 1,41x větší tepelné zatížení na mm2.

Jinými slovy všechny vysokofrekvenční CPU jejichž frekvence jdou nadoraz a jsou limitovány teplotou hot spotů, budou mít problém dosáhnout stejné frekvence. Pro stejnou teplotní hustotu musí frekvence klesnout zhruba 0,89x. Tedy pokud by Zen3 dosáhl na 5GHz, tak jeho shrink na 5nm by šel na max 4,5GHz. O tomhle přesně mluvil Norrod, že max frekvence budou z těchto důvodů klesat. To se samozřejmě týká jen desktopu a částečně NTB. Servery jedou tradičně kolem 2,5-3GHz, takže tam dojde k navýšení frekvencí, stejně jako u ARMů a všech CPU co nejedou na max frekvence.

Jinými slovy nový Apple A14 i Cortex A78 opět zvýší IPC i frekvence, takže dojde k navýšení celkového výkonu o těch 30%. Kdežto Intel i AMD budou muset jít s frekvencemi na 5nm podstatně dolů a protože IPC navyšují v průměru sotva o 10% za rok, tak celkový výkon v podstatě vůbec neporoste. Jinými slovy pokud Zen4 bude mít zlepšení IPC menší než těch 12% o co klesnou frekvence, tak celkový výkon klesne oproti Zen3. To je důvod proč Apple A13 na 2,6GHz drtí Zen2 na 4,7GHz a nová A14 bude o dalších 20-25% rychlejší a vydrtí tentokrát všechno, i 9900K na 5,3Ghz i nový Zen3. Game over pro všechny co nemají 6xALU :D

+1
-13
-1
Je komentář přínosný?

Tobě se zase protrhla Alu čepička viď? ;)

+1
+15
-1
Je komentář přínosný?

to nebylo hezký, ale pobavilo! :-D

+1
+7
-1
Je komentář přínosný?

Jo, kdo nemá argumenty, tak napíše alespoň krávovinu o Alu čepičce a hned se z nuly stane king. Alespoň může na chvíli zapomenout na fakt, že jeho PC procák oproti iPhonu je pomalejší v ST, má poloviční IPC a celkově je asi o 5 let pozadu ve vývoji :D

+1
-6
-1
Je komentář přínosný?

Myslím, že existují státy, kde by ses s tím svým 6xALU Apple A13 mohl i oženit, nebo minimálně si na něj změnit jméno :)

+1
+1
-1
Je komentář přínosný?

Nemohla. Má 6xALU. :)

+1
+6
-1
Je komentář přínosný?

Pardon, ale vy jste mentálně postižený?

+1
+7
-1
Je komentář přínosný?

no jo, ale furt je to tak, že ARM dokáže emulovat x86 kód jen velmi pomalu, kdežto obráceně je to poměrně hukot.

+1
+6
-1
Je komentář přínosný?

x86 emulovalo PowerPC v Applu s koeficientem 0,6-0,7. To není žádný hukot, ale v podstatě stejná penalta jako má Windows on ARM při emulaci x86 kódu. Čistě teoreticky by měl RISC stroj emulovat CICS kód lépe než naopak, ale v praxi to vychází zhruba nastejno. Nejspíš to bude tím, že IPC pro identický kód v ARMv8 a x86-64 se liší cca 10%.

+1
-4
-1
Je komentář přínosný?

Evidentne nevis o cem blabolis a zobecnujes.

Neni pravda, ze tepelne zatizeni roste tak jak myslis. Jsou rozhodne casti (treba ALU), ktere kdyz provadi specialni operace (napr. AVX) tak se dokazi dost slusne rozpect. Ale tohle prave resi inteligentni navrh CPU. Tak aby si nemel hotspoty vedle sebe.

Norrod nerikal, ze max frekvence budou klesat. Ale ze skalovani skrze frekvence bude klesat. Protoze frekvence nerostou.

Co Apple zvysuje nebo ne nikoho nijak netrapi. Apple sam neveri svym cipum, ze by dokazaly alespon srovnat vykon x86, proto je nedava do Macu. Ani do Macbooku. Pro content-creation jsou proste nepouzitelne. Take Apple zvysuje IPC kolem 10-15%. Napr. A12 oproti A13 zvedl frekvence o 7%, IPC cca o 12% a celkove tedy vykon o cca 19%. Nic co by AMD nedokazalo ;-)

Jestli klesnou frekvence u ZEN4(5) oproti ZEN3 a jeho oproti ZEN2 neni vubec jiste. Zatim podle zprav to vypada, ze naopak by meli vzrust. Pokud je proces specialne usity na miru AMD, ktera si diky chipletovemu navrhu muze dovolit vetsi koncentraci tepla na jednom miste jednoho chipletu.

+1
+4
-1
Je komentář přínosný?

teoreticky mas pravdu, prakticky je to na diskusiu

pozri sa do minulosti na posledne roky: intel v desktope frekvencie LEN a LEN zvysuje, ked som svojho casu videl 1-vlaknovy boost noveho hasswelu 4,5 ghz ci kolko, skoro mi oci vypadli, dnes sme na 5,3 ghz ... plati to aj o vsejadrovom booste a frekvenciach vseobecne ... potom necudo ze intel cpu zere aj vyrazuje 2x viac ako udava TDP (a aj to len pocas trapneho casu TAU trvajuceho par desiatok sekund, lebo inak by sa CPU roztopil)

amd sa dari vyzarovane teplo na jednotku plochy drzat na uzde, aj tu sice CPU zeru a vyzaruju viac ako TDP, ale nie je to katastrofa ako u intelu, staci sa pozriet na frekvencie prvych reznov1000 cez rezne2000 az po dnesne rezne3000, frekvencie len stupali (aj v desktope aj v ntb sfere) ... zrejme to suvisi aj s:

- hustotou tranzistorov, intel je so sovjimi 14nm++++ niekde medzi 90-101 MTr/mm^2, tsmc ma pri svojich 7 nm a HP cipoch "iba" cca 67 MTr/mm^2 a pri mobilnych SoC cipoch cca 95 MTr/mm^2
- frekvenciami, wono amd ma tie frekvencie v celom spektre furt o 1/2 ghz nizsie jak intel a to je dalsi faktor preco menej kuri a zere
- k znizeniu vyzarovaneho tepla na jednotku plochy cipu moze dalej prispriet aj samotny logicky navrh cipu, tak aj jeho fyzikalna konstrukcia

+1
-2
-1
Je komentář přínosný?

Ehm... zdroj pro tu uzasnou Intelackou hustotu tranzistoru?

Podle tohohle si tvuj mozek asi upsoukl a prekroutil hodnoty a cedulky :D
https://www.techcenturion.com/7nm-10nm-14nm-fabrication

+1
+2
-1
Je komentář přínosný?

To chce odvahu písať také nezmysly. Intel 101 MTr/mm^2 dosiahol jedine na papieri a to u svojich 10nm. Reálne menej. A u 14nm je rád, že má polovičnú denzitu.

+1
+1
-1
Je komentář přínosný?

> Navíc jaký má význam dát si do specifikací "až 5,2 GHz", když to na té frekvenci jede jen chvíli (pár sekund). Lepší mít "jen" 4,6 GHz a delší dobu (pár minut).

V praxi bude často lepší to druhé (byť někdy může být lepší i vyšší boost na kratší dobu), ale marketingově je lepší to první.

+1
+3
-1
Je komentář přínosný?

"V případě x86 procesorů, kde je řeč o bezmála 2× vyšší frekvenci a tedy rozsahu mimo energetické optimum procesu, nejsou tyto charakteristiky dosahovány a posun taktovací frekvence mnohdy odpovídá spíše zlomku avizované hodnoty."

Mimochodem, proč je v případě (desktopových) x86 procesorů tlak na vysoké frekvence mimo energetické optimum procesu? Kdo chce mít slušný výkon s nízkou spotřebou musí sáhnout po NTB, protože nic jiného není dostupné ... Manuálně si podtaktovat CPU může být při dnešní komplexitě nastavení na dlouho, než se najde nějaké smysluplné optimum pro nastavení frekvencí a spotřeby, navíc na to ne každý má výbavu a znalosti, aby si s tím vyhrál.

Kupříkladu existuje nějaký jednoduchý návod jak z Ryzen 3 2200G udělat 2200GE / Ryzen 5 2400G > 2400GE, resp. z Ryzen 3 3200G udělat 3200GE / 3400G > 3400GE?

+1
0
-1
Je komentář přínosný?

"Mimochodem, proč je v případě (desktopových) x86 procesorů tlak na vysoké frekvence mimo energetické optimum procesu?"

Protože zákazníci Intelu z řad pubescentů masturbují nad 5+ GHz frekvencemi?

+1
+4
-1
Je komentář přínosný?

Pretoze kopec uloh skratka je single thread a nieje mozne ich napisat inak
keby sme mali 10GHz procaky tak by si to hned poznal

+1
0
-1
Je komentář přínosný?

Úsporný CPU si může udělat snadno každý. U Ryzenu 3000 si v BIOSu nastavíš hodnodu PPT na 45W a CPU ti nepoleze přes tuto hodnotu.

Jinak je 100x snadnější vyhnat nahoru frekvence než zvyšovat IPC. Energeticky je výhodnější zvyšovat IPC, ale bolí z toho mozkové závity což v Intelu ani AMD nemají rádi. Proto Intel i AMD již nyní mají velký problém s Gravitonem2 od Amazonu. Ten nastavil poloviční cenu za výkon než x86 a teď s přicházející krizí to bude masakr x86 motorovou pilou s nápisem ARM. Amazon má 34% všech cloudových služeb na světě, je to suveréně největší poskytovatel. Intel s AMD nemají šajnu jaké těžké časy je čekají.

+1
-4
-1
Je komentář přínosný?

Blabolis jako obvykle. Samotnej amazon ma na webu: "deliver up to 40% better price performance". A to jen proto, ze za nizky vykon armu nasadili i adekvatne nizsi cenu.

+1
+2
-1
Je komentář přínosný?

IPC má mnohem vyšší ten Graviton2. Díky absenci SMT, které snižuje IPC na vlákno o 40%.

Nemystifikuj a přečti si recenzi Gravitonu2:
https://www.anandtech.com/show/15578/cloud-clash-amazon-graviton2-arm-ag...

Někde ušetříš 40%, někde 60%... záleží kolik jader má VM. A jako bonus navíc máš větší výkon na vlákno než u x86 VM. x86 je pomalejší a dražší... a to se vyplatí :) Ten Graviton2 jehož výrobní cena včetně licencí je někde kolem 300$ musí Amazon prodávat levněji než EPYC který stojí 3500$.

+1
-1
-1
Je komentář přínosný?

Kazdej se muze na web amazonu kouknout. Najit si tech 40 % co tam amazon pise. Najit za jaky ceny amazon nabizi sluzby. A presvedcit se, jak tu celou dobu blabolis.

+1
0
-1
Je komentář přínosný?

Akurat ten sw pre arm nieje vobec optimalizovany. Vecsinou najdes optimalizacie fakt len pre x86 :(
Kompilator ti vektorizaciu malo kedy spravi alebo spravi vobec spravne!

Staci si precitat blog na cloudflare, ked s tym experimentovali.
A neviem ci do toho pani z amazonu budu investovat.
Urcite tadial cesta vedie, ale je lepsie si to otestovat a porovnat na aplikacii ktoru budes pouzivat.

+1
0
-1
Je komentář přínosný?

Amazon nic optimalizovat nemůže, protože ti jen pronajme virtuální stroj a co si ty na něm spustíš je tvoje věc. Tipnul bych si že na tom většinou běží nějaké webové služby jako eshopy a tam nějaké optimalizace pro AVX512 fakt nevyužiješ.

+1
-2
-1
Je komentář přínosný?

Ten "kopec úloh" je téměř výlučně umělý. Snad jediná rozumná výjimka jsou emulátory procesorů (protože musejí emulovat sekvenční automat). Drtivá většina zbytku bude nekompetence programátora.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.