Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Nástup 5nm procesu bude rychlejší než u 7nm, TSMC zvýšila investice o 40 %

Zvýšení denzity o 80 % je obrovské, takže já už nějaké frekvenční orgie nečekám, resp, čekám je až s koncem křemíkových procesů někdy ve vzdálenější budoucnosti. A jak říká Redmarx - to už bude tak malý, že to bude odcházet do křemíkové nebe za pár let!!!

PS: Snad AMD nezvýší počet jader a půjde hlavně po zvětšení IPC za každou cenu (větší-rychlejší cache, mohutnější jádro...). Dnešní stav cen (osmijádra v mainstreamu, dvanáctijádro ve vyšším mainstreamu a 16-64 v highendu) mohou z hlediska počtu jader zmrazit klidně na 3 roky.

+1
+3
-1
Je komentář přínosný?

přesně, než se vývojáři naučí využívat 24 nebo 32 vláken jinde než při konverzích videa či archivaci uplyne ještě hodně vody.

+1
0
-1
Je komentář přínosný?

Každá úloha má nějaký strop paralelizace (je pro každý scénář jiný), nad který se nedá jít i kdyby se vývojář stavěl na hlavu. Zrovna to video a archivace jsou příklady úloh, které se rozhazují na více vláken relativně jednoduše (i když i tam se u masivně paralelních CPU začíná narážet na limity)

+1
-1
-1
Je komentář přínosný?

Tak video se hlavne kvuli paralelizaci pocita na grafikach... Na to maj procesory jader porad moc malo...

+1
0
-1
Je komentář přínosný?

Video na grafikách počítají ti, co se spokojí s nižší kvalitou. CPU enkodér dosahuje lepších výsledků. Čím novější codec tím je to zřetelnější.

+1
+2
-1
Je komentář přínosný?

Pletes si HW enkoder v grafice se SW kodovanim pres CUDA, jak to delaj profi video strizny...

+1
0
-1
Je komentář přínosný?

IPC jde ruku v ruce se šířkou jádra. Jenom takové malé srovnání:

- 2012 - Intel IvyBridge (3xALU)... Apple A6 (2xALU) .... Apple zaostával
- 2013 - Intel Haswell (4xALU)... Apple A7 (4xALU) .... Apple se dotáhl na Intel
- 2017 - Intel CoffieLake (4xALU)... Apple A11 (6xALU) .... Apple lídrem vývoje CPU, IPC výrazně nad Skylake

AMD:
- 2016 Bulldozer (2xALU)
- 2017 Zen 1 (4xALU)
- 2020 Zen3 (6xALU?)... 19h Family by leccos napovídala.

Ostatně Intel se svým 6xALU GoldenCove přijde v roce 2021. Na lelkování pouze s L3 cache AMD nemá čas. To hlavní musí být nové jádro jinak bude mít AMD brzy problém.

+1
-3
-1
Je komentář přínosný?

Uvidíme, až začne Apple cpát ty svoje SoC do těch jejich MacBooků nebo jak se to jmenuje... To teprve uvidíme, co dokáže (řekněme) GoldenCove (6xALU?) proti nějakému A14(?) s ?8xALU? ... Taky by se dalo do nějakého hypotetického procesoru "šestium" narvat 12xFPU+4xALU a v testu využívající těch 12xFPU by to převálcovalo cokoliv jiného...

+1
0
-1
Je komentář přínosný?

Přesně tak, teprve reálné porovnání A14 Macbooka s Intel notebookem ukáže jak se věci mají. Ale logicky Apple by do toho nikdy nešel kdyby na tom měl být hůř než s Intelem.

Jestli A14 bude 8xALU to by byl fakt úlet. To jako optimista ani nečekám. Ono jde hlavně co všechno ty ALU umí. Typicky Intel má 4 tučné ALU, ale Apple má ty dvě navíc jako pomocné/větvení. Problém je scheduler, každá ALU navíc znamená další scheduler, což je velký zásah do jádra, nárůst komplexity čipu. Proto je jednodušší přidat ALU jednotce další funkci jak to má Intel. Jenže Apple se nebál a překopal jádro aby měl volné ruce pro budoucí rozšíření. Takže realisticky ta nová A14 přinese další funkce pro ty pomocné ALU a tím zvýší podstatně výkon. Spíš bych to viděl na rozšíření ze 2xLSU na 3xLSU. Tam asi bude největší bottleneck IMHO.

+1
-2
-1
Je komentář přínosný?

Mýlíš se, Apple by to toho šlo i kdyby na tom bylo trochu hůř než s Intelem, pro ně je prioritní mít vlastní návrh CPU a mít možnost dělat těsnou integraci s koprocesory.

+1
+4
-1
Je komentář přínosný?

Presne. Richie nechape zakladni souvislosti a motivace vyrobcu SW a HW.

+1
+1
-1
Je komentář přínosný?

Nejde o to zda se mýlím já. Jde o to, že Apple má CPU s největším IPC na světě už od roku 2017 kdy vydali A11 s jejími 6xALU. A přesto se zatím neodvážili jít do notebooků. Můžete si přitakávat jak chcete, ale tváří tvář faktům by jeden by řekl, že se mýlíte vy dva. :D

+1
-3
-1
Je komentář přínosný?

To dává smysl používat CPU s největším IPC na světě do telefonů namísto výpočetní sféry. (y)

+1
+2
-1
Je komentář přínosný?

A vazne si myslis, ze by to lidi kupovali, kdyby to bylo slabsi nez Inteli model a navic nekompatibilni se stavajicim SW?

+1
0
-1
Je komentář přínosný?

Pokud bychom byli ve světě PC, tak by tato námitka byla oprávněná. Ale tady se pohybujeme v jablečném světě, kde platí jiné zákony. Co se týká kompatibility SW, to už má Apple naostro vyzkoušené při přechodu PowerPC->Intel. A oni začnou u tenkých macbooků kde citlivost na výkon je nižší a spíš se hledí na výdrž na baterky.

+1
0
-1
Je komentář přínosný?

Ano, maj to vyzkousene a proto vedi, ze bez emulatoru to nepujde, stejne jako to neslo tehdy. Rozdil je v tom ze intel byl dost vykonej na to, aby to powerpc zvladnul emulovat...

+1
0
-1
Je komentář přínosný?

běžný scénář bude takový, že se v reálu prakticky ohledně výkonu CPU nic nepozná a bude to hlavně o syntetice, protože výkon Applu bude zajišťovat SW šitý na míru ASIC obvodům a GPU výpočtům (v podstatě i teď to přináší v některých app výrazný náskok i na x86 CPU ) :) >> stačí třeba mrknou jak si vede v praxi např. Affinity apod.

v podstatě i na slabším HW to může předvádět "prémiové" výsledky, když se dobře vyladí "kód" :) (dokazuje to Apple svět i ten konzolový )

+1
0
-1
Je komentář přínosný?

IPC je zavisle na zatezi stejne jako na moznostech HW.

Kdyz budes mit 10ALU v jadre, ale OS a zbytek SW nebude schopen to tam cpat (optimalizovane kompilatory, specialni frameworky na vyvoj, atp.), tak se budou flakat.

Apple rozhodne neni leadrem CPUcek. Jen zvolil pro jejich cely system optimalnejsi reseni. Maji pod kontrolou cely SW ekosystem. Delaji vlastni OS, kontroluji jake aplikace se tam objevuji.

AMD a Intel tohle nemaji, oni delaji obecne x86 procesory pro nespocet operacnich systemu, ktere ani kolikrat nesdili stejne zaklady (modularni/monoliticke).

Nenasel jsem nikde aktualni konkretni IPC (instruction per cycle) ani pro Apple, ani pro Intel, ani pro AMD (pro mene chapave to ma byt cislo od 1 do maximalniho poctu exekucnich jednotek v jadre). Posledni co jsem videl bylo 2.11 pro 3ALU jadro u AMD K10. Takze tehda bylo vytizeni ALU nejakych 70%. Coz je dost malo. Tedka kdyz ma Intel i AMD 4 ALU a zaroven pracuji na cache, na ruznych optimalizich predvidani atp. treba jsou na 70% 4ALU. Ale podle me porad maji prostor zlepsovat to aniz by sli do vice ALU.

Zaverem, vice ALU neznamena v zadnem pripade korunku lidra CPU navrhu.

+1
+4
-1
Je komentář přínosný?

>Posledni co jsem videl bylo 2.11 pro 3ALU jadro u AMD K10.

To nie je pravda

AMD Takes High-Performance Datacenter Computing to the Next Horizon
SAN FRANCISCO
11/06/2018

Footnotes

AMD, the AMD Arrow logo, EPYC, Radeon and combinations thereof, are trademarks of Advanced Micro Devices, Inc. Other names are for informational purposes only and may be trademarks of their respective owners.

1. Estimated increase in instructions per cycle (IPC) is based on AMD internal testing for “Zen 2” across microbenchmarks, measured at 4.53 IPC for DKERN +RSA compared to prior “Zen 1” generation CPU (measured at 3.5 IPC for DKERN + RSA) using combined floating point and integer benchmarks.
https://www.amd.com/en/press-releases/2018-11-06-amd-takes-high-performa...

+1
0
-1
Je komentář přínosný?

No zaprve je to pravda, protoze ja jsem rikal, ze posledni co jsem videl, tohle jsem nevidel, nebo zapomel :) Muj vyrok je stale pravdivy.

Ale k veci, diky za upozorneni a link. A diky za to, ze presne popisuje co jsem rikal.

Velice speficicky test, kombinace FPU a ALU a dokaze vyuzit AMD Zen jadro na kolik?

Zen (1,+,2) ma 4x ALU, 3x AGU, 2xFPU MUL, 2x FPU ADD. Kdyz nepocitame AGU, tak jsi na 8 jednotkach a dokazi z toho vyzdimat jen 4.53IPC? 54%!

Dulezite je (hlavne pro Richieho), ze ve specifickem testu se optimalizacemi v scheduleru, prediktoru, cache, ruznych dalsich bufferu, atp. dostali z 43% efektivity (Zen1) na 54% efektivitu (Zen2), zvysili o 30% efektivitu aniz by pridali jedine ALU navic.

+1
0
-1
Je komentář přínosný?

1) Je vidět že jsi nikdy nic neprogramoval v assembleru jinak bys nemohl napsat takovou pitomost a vynechat LSU jednotky. Hraješ si na odborníka a přitom taková šmíra.

2) Nauč se počítat s procenty:
Zen 1 je 10-wide, tedy má průměrné vytížení 35%
Zen 2 je 11-wide, tedy má průměrné vytížení 41%

3) Průměrné hodnoty vytížení jsou k ničemu (pro orientaci budiž), protože ti nic neřeknou o zpracování v burstu (nárazově). A tam leží ten největší bottleneck, proto Apple šel cestou 6xALU a dosáhl 1.58x větší IPC než Skylake. Ze stejného důvodu se nedá říct, že Zen 2 by mohl mít polovinu ALU a byl by v pohodě. Nebyl, u Bulldozeru to zkusili a jak dopadli. Takhle to nefunguje. To je jako bys dimenzoval výkon motoru formule 1 na průměrnou rychlost jednoho okruhu, což může být např. 250km/h. No a pak se divil, že všichni ostatní kolem tebe na rovince profrčí 380km/h protože mají 2x větší výkon (dimenzovali motor na výkonový peak pro zrychlení a max rychlost). Líp to vysvětlit neumím.

+1
-2
-1
Je komentář přínosný?

Co to meles za kraviny?

1) V assembleru jsem programoval, LSU jsem vynechal naprosto zamerne.

2) Ty procenta se odviji od toho co jsem psal. Navic sam si tady dlouhodobe protirecis. Celou dobu tu tvrdis, ze Apple se svymi 6x ALU je super-duper zalezitost. Ale tady se snazis pouzivat i ostatni jednotky, nez jsou jen ALU. Takze ti to konecne doslo, nebo mas schizofrenii?

3) Jenze tezko neco spustis "burstove". Rozumis tomu asi jako burtu(spekacku). Chapes vubec, kolik instrukci se provede napr behem par minut beziciho testu? Burst je ti absolutne k nicemu a neni to zadne uzke hrdlo. Potrebujes soustavne udrzitelne IPC (throughput). O to ti jde a vzdy optimalizujes architekturu na to. Protoze bursty nikoho nezajimaji.

3a) To ze ma v specifickem testu vetsi IPC Apple nez Intel neni relevantni ani to neni dost dobre pomeritelne, protoze nemas stejne platformy. A11 je mobilni chip na kterem bezi uplne jiny OS nez na tom Intelu a ten chip ma jinou architekturu, coz znamena uplne jiny prekladac, atp. Je to neporovnatelne a jestli to nechapes, tak nezabrusuj do takove diskuze.

3b) Bulldozer modul byl AMD odpovedi na Hyper-threading. Je to potreba dat do souvislosti. AMD Bulldozer modul mel vlastne 4 ALU. S tim AMD do toho navrhu slu, ze naproti 1 jadru K10 udelaji jeden modul Bulldozeru, a budou mit o 33% vice ALU a k tomu chopnost zpracovavat 2 vlakna naraz. Jenze jim to nevyslo tak jak by si prali.

3c) Co to meles o formulich? Tvuj pripad nedava smysl, protoze si ani nedomyslel charakter drahy. Kdyz budes mit finalni rovinku kde muzes valit 380 podle tveho prikladu, ale bude to jen 10s a dalsich 60 sekund stravi motor v neoptimalnim stavu, protoze kvuli zatackam na draze pojede jen 150km/h, tak mu to bude zbytecne.

+1
+1
-1
Je komentář přínosný?

zen1 mal 3 alu nie 4
to az zen2 ma 4 alu

+1
0
-1
Je komentář přínosný?

Zen i Zen 2 mají 4 ALU. Co se zvýšilo, je počet AGU (ze 2 na 3).

+1
0
-1
Je komentář přínosný?

jo clovek sa v tom mnozstve informacii uplne straca

+1
+1
-1
Je komentář přínosný?

Ty si delas srandu, ale nikdo nevime, 7nm tu neni tak dlouho, aby mohl nekdo rict, ze to skutecne vydrzi dyl nez tech par let.
A ikdybych se mylil, kdyz tu ctu od jinych ferdu, jak je Apple lidrem vyvoje CPU, tak myslim, ze takovy nesmysle ja tu nikdy neplacam. :-)

+1
0
-1
Je komentář přínosný?

Však já si dělám srandu jen trochu. Snižování životnosti s menšími nm je fakt, jen nevíme o kolik přesně.

+1
0
-1
Je komentář přínosný?

velmi spatna zprava pro intel

+1
0
-1
Je komentář přínosný?

Tak je to dobrá zpráva pro všechny zákazníky TSMC, kteří v budoucnu hodlají využít tento proces, včetně AMD. Intel bych ale v žádném případě nepodceňoval. Je tedy pravda, že nástup Zenu totálně neukočíroval, ale v průběhu 2-3 let se zase vážky mohou přehoupnout. Pro nás zákazníky by ale bylo dobře, kdyby jeden výrobce ztrácel na druhého max. do 10% co se výkonu produktů týká, aby dobře fungovalo konkurenční prostředí a tak je nutilo vyvíjet a neustrnout na dlouhá léta na bodu mrazu, jako to za poslední prakticky dekádu předvedl Intel.

zajímavé povídání co by mohlo být v CPU během pár let za novinky např. tady:
https://www.youtube.com/channel/UCRPdsCVuH53rcbTcEkuY4uQ/videos

+1
+1
-1
Je komentář přínosný?

Intel hlavně neukočíroval 10nm. Čekat, že se 7nm se mu povede líp, je čiré bláznovství.

+1
-1
-1
Je komentář přínosný?

Tohle podceňování Intelu nechápu. Z 10nm se poučili, kritičnost situace si uvědomují a miliardy zatím mají. 7nm se jim musí povézt lépe, protože když by to bylo jako 10nm průser, tak už je nezachrání vůbec nic. Do roku 2022 to nějak zvládnou díky svojí velikosti/vazbám, ale pak už musí něco předvézt (nemyslím marketingové oblbování).

+1
+1
-1
Je komentář přínosný?

ktore z tych videi to vysvetluje?

+1
0
-1
Je komentář přínosný?

S těmi 5 GHz bych byl opatrný, zdá se že je to jakási fyzikální hranice (nebo spíš hranice, způsobená souhrou několika fyzikálních omezení). Možá je to ve skutečnosti 5,1 nebo 5,2 GHz, co já vím. Ale vypadá to, že se tam někam složitým křemíkovým čipům vůbec nechce. Tedy pokud je tam neposune například tekutý dusík.

+1
-2
-1
Je komentář přínosný?

To samé jsem tvrdil o 4GHz před 10 roky.
A za 15 let to budu tvrdit o 6GHz.

Teď když to čtu po sobě, tak to zní hrozně. 10GHz se nedožiju. A to jsem při vydání 1GHz (AMD před cca 20 lety) vyhlížel těch 10GHz.

+1
0
-1
Je komentář přínosný?

5 GHz není žádná nepřekonatelná hranice. Profi bezdrátové spoje běhají na 60/80 GHz a tranzistory to vpohodě dávají. Problém je délka pipeline CPU. Intel Skylake má 19-stage pipeline. Kdyby těch stage bylo 31 jako u P4, tak by mohly být kratší a dosahovat vyšších frekvencí. Jenže předávka dat mezi stage taky něco stojí (čas, energie) a navíc penalta od špatné predikce musí zahodit data ze všech ovlivněných stage (čím víc stage, tím horší penalta). Takže je to kompromis a prakticky všechny moderní CPU mají kolem 18-ti stage.

Dnes je spíš problém lokální přehřívání. Můj 3700X běžně v loadu vyleze na limitních 95C a začne throtlovat už při 4.4 GHz. Na 5nm 80% více tranzistorů na stejné ploše bude znamenat další nárůst tepelného výkonu na mm2. TDP zůstane stejný, jádro bude menší. Proto se Intel drží zuby nehty 14nm, protože jinak by těch 5GHz neuchladil na vnitřním křemíku. Velkou roli budou hrát techniky snižující spotřebu, vypínání různých částí CPU (power gating) a také zvyšování IPC nikoliv brute force, ale pomocí efektivnějších/chytřejších tranzistorových cest. Úsporný čip bude mít paradoxně i větší frekvence. AMD má v současnosti výhodu nad Intelem jak v úspornosti, tak i ve vyšším IPC. Takový 9900K by byl na 7nm naprostá tragédie co se týče frekvencí.

+1
0
-1
Je komentář přínosný?

spíš by se dalo upravit tvrzení že současný návrh cpu je "zabetonovaný" na frekvencích mezi 4-5Ghz a to roky.
Jinak k těm tvým teplotám, čím to chladíš?? Mě to neleze ani v OCCT testu s AVX přes 76 stupňů a to si říkám že to je hodně žhavé, ta teplota se kumuluje v cpu, to je fakt protože z větráku jde pořád jen mírně teplý vzduch (Artic Freezer 33).

+1
0
-1
Je komentář přínosný?

Nesouhlasím, není to zabetonovaný. S každým menším výrobním procesem se tranzistory zrychlují, frekvence rostou. Podívej se na úsporné ARMy v mobilech, začínaly kolem 1GHz a dnes už lezou ke 3Ghz. Nebo na servery. Staré Xeony 6c běhaly kolem 2Ghz, dnes máš 64c Epyc a běhá 2.5 GHz. To jsou masivní nárůsty výkonu. To jenom desktop zamrznul protože to není priorita pro výrobce. 90% peněz totiž leží v serverech a mobilních zařízeních.

Mám normálně stock chladič, to je celkem OK chladič, jako stock je naprosto skvělej, žebra jsou jen vlažný. Původně jsem jej chtěl vyměnit, ale docela dobře ofukuje napajení desky, takže tam nemusí být přídavný větrák jako s nějakým towerem, je to nádherně tiché. Stejně budu upgradovat na 16c Zen3 příští rok, takže to provětrám potom :)

+1
-1
-1
Je komentář přínosný?

Až na to, že ten „zamrzlý" desktop vykazuje stejný růst čísel jako server:)))). Asi proto, že to je ten samý křemík...

+1
+1
-1
Je komentář přínosný?

ARMy v mobilech za cinaly nekde kolem 200MHz. Xeony zacinaly na 1,2 GHz. Desktop zacinal na 1MHz (x86 na 5 MHz). Kazdy samozrejme v jiny dobe. Cili narust vykonu desktopu byl vyssi nez u cehokoli jinyho.
Desktopy jelikoz u nich byl vykon to nejdulezitejsi a protoze je jejich vyvoj nejdelsi (v porovnani s ARM a x86 serverama), tak proste narazili na strop v podobe frekvence/odpadni teplo driv...

+1
0
-1
Je komentář přínosný?

Nemáš pravdu :) Sálové počítače jakožto servery s relátky fachali na cca 10 Hz. Takže servery udělali 100 000x větší pokrok než desktop na 1 MHz :D

+1
-1
-1
Je komentář přínosný?

IMHO se mýlíš.
a) za 15 let zde bude muset být něco post-křemíkového (jinak bude stagnace jako prase) a v takovém případě je 6GHz dost málo.
b) Pentium 4 571 3,8GHz je stará 8 let, takže to tvoje tvrzení o 4GHz bylo zbytečně pesimistické.

Zatím to opravdu vypadá, že když všechno půjde fakt dobře (Intel vyladí 14 nm k naprosté dokonalosti + vylepší pájku, vylepšená AMD architektura si dobře sedne s novým 7nm procesem), tak se dočkáme procesorů s výrobcem nastavenou frekvencí na maximálně 5,2GHz.

+1
0
-1
Je komentář přínosný?

Cccccooooože? Pentium 4 571 že je staré 8 let? Mám tu starší sestavu s Core2 Duo... Viz Intel:
https://ark.intel.com/content/www/us/en/ark/products/27476/intel-pentium...
To CPU je starší, než 14 let :D Jo, to se nezdá, letí to...

+1
0
-1
Je komentář přínosný?

Dokonce, takže byl ještě větší pesimista než jsem myslel.

+1
0
-1
Je komentář přínosný?

Tak je to celkem logicke vyssi hustota a celkove mensi plocha zvysuje naroky na chlazeni a u tak slozitych a energeticky narocnych cipu to bez TSV chlazeni nepujde (proc hned tak komplikovane s dusikem ;) ) ..dalsi otazkou je i spolehlivost/zivotnost

+1
0
-1
Je komentář přínosný?

TSV spolehlivost zlepšit nemůže a životnosti se obávají už dvě dekády. Ale taky je tu cena.

Já dusík taky moc nemusím (sportovní komentátor Michal Dusík má výjimku). Řídím se praktickým pravidlem "nikdy nelez s chlazením pod rosný bod".

+1
0
-1
Je komentář přínosný?

mě přijde že spíš (nebo i) budou profitovat z větší denzity grafické karty, tam "stačí" zvětšovat počty všeho

+1
+1
-1
Je komentář přínosný?

"Zůstává nicméně faktem, že nájezd 7nm výroby, ač nakonec zhruba o rok zpožděný,"

Aký rok? Voči čomu? 7nm TSMC prišlo len 1 rok po 10nm. Ročné meškanie ktoré ste si vymysleli ani nedáva zmysel. Ako? Omg

Nejaké meškanie pozorujem len v súvislosti s miestnymi článkami.

"byl přecijen rychlejší než nájezd 16nm procesu,"

Btw.: pri vydaní 16nm si tu tvrdil, že prechod na nový proces bude trvať minimálne 6 rokov.

Bude trvať 6 rokov kým uznáš, že si sa fatálne mýlil (a nie len v tomto)?

"slabší stránkou je pak maximální zvýšení taktů"

Slabšou stránkou?

Ak si to porovnáme so samozvaným "lídrom" (Intelom samozrejme), ktorému s novým procesom padajú takty na polovicu (pri zachovaní alebo zvýšení spotreby), je úspešný každý proces ktorý aspoň stagnuje.

No a v tom kontexte je akékoľvek zlepšenie skôr zázrak.

+1
0
-1
Je komentář přínosný?

Na to, že pomalu na 4GHz taktu jel známý spalovač desek P4 Prescott z roku 2003-4, překonat po 15 letech 5GHz je mizerná bída.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.