Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Zen 3 prý zvýší IPC o ~8 % a takty o ~200 MHz

Také jsem střízlivější v očekávání a nazýval bych to spíše takový Zen2+ "Inteláckou TokTiku" jeden rok revoluce další jen evoluce. Vyladění a optimalizace.
Ryzenu jsem fandil od začátku, ale pořídil jsem až 2700X z druhé generace, kde už bylo vše odlazené a hlavně lepší podpora ze strany OS, kdy se už naučil pracovat a parkovat s tolika jádry/vlákny.

+1
+7
-1
Je komentář přínosný?

Kdyby AMD chtělo jen mírné změny jako tu unifikovanou L3 cache, tak by šla cestou vylepšeného výrobního procesu N7Performance (jako šel Apple s novou A13, předchozí A12 používá stejný výrobní proces jako Zen2). Navíc je pak možné jít jednoduše na 6nm. Pokud ty větší změny má přinést až Zen4 (jakožto nový základ i pro budoucí CPU), pak je přinejmenším podezřelé nepoužití těchto ekonomicky výhodných variant výrobních procesů.

7nm EUV používá jiné knihovny, jiný počet vrstev a jedná se o překopání celého křemíku a dostanu horší parametry než u 6nm? Divné. Leda že Zen 3 bude mít zbrusu nové jádro, které poslouží jako základ dalším třem čtyřem generacím CPU. Na 5nm a 3nm se bez EUV neobejdou.

Jinak leaky o Zen3 uživatele Zoo, který měl přesné informace o Zen 2, jsou tyto:
- bez AVX512
- první ES běhají na +0.2 GHZ oproti Zen 2
- IPC +1X% (tedy 10-19%)
- o SMT nepíše nic, nepotvrzuje SMT2 ani nevyvrací SMT4

Dále víme, že:
- Mike T. Clark (Zen1) vede vývoj Zen3, takže pokud mají být velké změny ALU jádra, tak se dají očekávat od tohoto týmu.
- Zen3 bude mít nové označení Family number 19h
- Už Zen2 přinesl masivní +20% IPC nárůst, dohromady s těmi novými 10-19% to vypadá na 30-39% což je skok jako z BD 2xALU -> Zen 4xALU. Takže těch cca +35% IPC by mohlo být dáno přechodem na nové 6xALU jádro (jako ten jablečnej A12)
- jinak těch 6xALU jádro má apple už od r 2017, další na tom pracují: ARM pracuje na A78, Intel pracuje na novém jádře GoldenCove (Keller), a vzhledem k tomu že AMD je technologicky napřed oproti Intelu, tak jejich 6xALU jádro nejspíš bude Zen3.

Jinak čestvý leak: Je to tu, Apple v 2020 představí MacBook Air s novým 8-mi jádrem ARM s větším výkonem než má Intel.
Zdroj zde: https://www.youtube.com/watch?v=hzKb_fV7UB8

+1
-5
-1
Je komentář přínosný?

Gratuluji Applu, že v roce 2020 překoná produkt firmy, která je v největší krizi ve své historii. Ale jak se říká, nemusí pršet, stačí když kape, takže třeba někdy v budoucnu překonají i AMD. Chce to větší výběr architektur.

+1
0
-1
Je komentář přínosný?

Pokud apple zvýší frekvence na 3.5 GHz, což není nereálné u nového čipu co se nazývá high-end CPU, tak budou mít výkon jako Intel Skylake na 5.5 Ghz nebo nejnovější IceLake na 4.4 GHz.

Ale stejně to bude pořád nenom v applu. My ostatní si koupíme Zen 3 :-)

+1
-3
-1
Je komentář přínosný?

Porad zapominas psat, ze ten tvuj vysneny vykon jako skylake nebo icelake budou mit jen v casti testu a v casti aplikaci. V celkovem vykonu budou stale patricne po armovsku zaostavat.

+1
+1
-1
Je komentář přínosný?

Tak FPU je o 30% slabší, to je pravda. Ale budoucí ARMy budou mít SVE2 vektory o šířce 2048-bit, takže opět konečná pro x86. Tu du du, dum.

Ale ten Apple má brutálně velký AI akcelerátor o výkonu 6 TOPs. Tohle Intel ani AMD neumí vůbec = 0 výkonu v AI. A nebudeme tu snad polemizovat, že AI je budoucnost. Tady je vidět jak x86 zaostává.

+1
-7
-1
Je komentář přínosný?

2048-bit vektory se v realnych aplikacich uziji jak? :D

Ja ti povim... HPC vedecke silene vypocty. Hmmm a tedka se podrz. SVE1 je tu s nami uz naky rok. A myslis, ze se rapidne rozsiruje v HPC segmentu diky tomu ARM? NE! Porad je hlavne zajem o x86_64 cpu + GPU.

Pokud chce Apple udelat AI tak aby ty sve ovce ridila skvele, muze to mit. Na AI jsou ale porad lepsi specificke akceleratory.

Nebudeme tu polemizovat, ze AI rozhodne jedina budoucnost :D A ted to nemyslim tak, ze bych se bal SkyNetu. AI v podobe, kterou lidstvo prokopava (machine learning, deep learning, neural network,...) smeruje k pomocnym pracem. Porad to bude tezce nepouzitelne pro velkou cast prace. A rozhodne ti nepomuze, ze tvuj CPU na mobilu, ktery musi resit milion uloh muze tohle utlumit a misto toho ti zlepsi radu, kudy do nejblizsiho Apple Store.

Na skutecne pokroky jsou tu specializovane akceleratory. A na ty se Apple nechyta.

+1
+3
-1
Je komentář přínosný?

SVE2 je scalable, tedy umí různou šířku vektorů 128-bit až 2048-bit.
Ty vůbec nevíš o čem mluvíš.

+1
-1
-1
Je komentář přínosný?

@Richie Rich:
- GoldenCove není nic jiného než původní Sapphire Rapids,
- po něm přijde Granite Rapids
- Keller přišel do Intelu teprve v dubnu 2018
- nová uarch pod Kellerovým vedením tak nepřijde dřív jak v 2023
- je spousta způsobů, jak zvednout výkon i bez navýšení počtu ALU

+1
+1
-1
Je komentář přínosný?

- máš pravdu s tím Intelem...
- Keller je tam už rok a půl, vývoj uarch trvá obecně 4-5 let, takže 2022/2023, souhlas
- s těma ALU nesouhlasím, IMHO bez zvýšení počtu výpočetních jednotek se IPC zvýšit nedá.
- ale nejsem odborník, takže pokud víš více než já, tak jmenuj hlavní způsoby, jak bys udělal třeba takový 2xALU Bulldozer rychlejší než IceLake. Nebo ten 6xALU SapphireRapids, který bude mít +40% proti IceLake.

+1
-1
-1
Je komentář přínosný?

Ty jsi fakt demagog.

IPC se da zvysit samozrejme uplne v pohode. A vidis to skoro pri kazde nove uarch. Skoky v ALU se deji jednou za deset let, ale vylepsovani cache, predpovidani, dekodovani, ruzne druhy zasobniku ktere vypomahaji... to vse zvysuje IPC. Tenhle tvuj nazor jenom doklada, jaky ignorant jses. Precetl sis, nebo skoukl si nejake pekne YT kde ti nekdo rekl ze vice alu vice adidas a protoze se neches zabyvat nicim dalsim, rozsirovat znalosti, nebo takove tvrzeni nedejboze skepticky podrobit zkoumani, tak si to jako totalni ovce prevzal.

Co se tyce toho Bulldozeru tak zaprve je to dost sileny pozadavek od tebe. Protoze ty architektury deli 8-9 let mezi vydanimi, coz muze byt klidne i pres 10 let vyvoje architektury. Vzhledem k tomu, ze Bulldozer byl zamyslen pro vyssi frekvenci a ty jsi chtel vyssi vykon (ne nutne IPC), tak vyssi vykon zajistis mnohem vyssimi frekvencemi.

Dalsi zpusob jak vylepsit vykon procesoru je vylepsit predpovidani aby ty dve ALU ktere mas opravdu valily 100% vyuzite, zadne bubliny.

Dalsi zpusob....

Jiste chapes, kam tim mirim.

+1
0
-1
Je komentář přínosný?

Sám si demagog.

Cache neprovádí žádné výpočty, takže nezvyšuje přímo výkon. Pouze umožňuje plynulejší zásobování výpočetních jednotek. Pokud samotné výpočetní jednotky nestíhají, tak ti žádná cache nepomůže, ani prediktor, ani sebelepší FPU.

To jsou výmluvy s tím BD. Výmluva na frekvence, které neuměl, na to že to je stará uarch............... jo aha, takže stačí jen dobrý prediktor. Jo jasně a tu o perníkové chaloupce znáš?

A prozradíš nám všem pročpak ti hlupáci v AMD se namáhali do Zenu dát 4xALU když jim vlastně stačilo jen vylepšit prediktor? :D

Klidně se tu ztrapňuj dál, mě je to jedno.

+1
0
-1
Je komentář přínosný?

Ty jsi fakt debil.

Rikal si jak se da zvysit vykon. Nerikal si nic o zadnem omezeni, navic primo neprimo se rict neda.

Kdyz ti cache dovoli zasobovat plynule vypocetni jednotky, mas PRIME ZVYSENI VYKONU.

Nestaci JEN obvody pro predpovidani vetveni. Rikam, ze je to DALSI zpusob zvyseni vykonu. Kdyz budes mit casto bubliny, cela pipeline se bude muset vyprazdnit, protoze byl spatny odhad vetveni, tvoje efektivni REALNY vykon jde do hajzlu. Pro dlouhodobe vyssi vykon musis mit I dobry prediktor.

S tim BD to nejsou vymluvy, ale overitelne fakta. Global Foundries meli problem a tehda AMD nemelo zadne dalsi nasmlouvane partnery, jako ma tedka. Stejne, jako je ve srackach tedka intel, protoze jeho 10nm vyroba nedosahuje kvalit (frekvenci) 14nm a on si nemuze dovolit vydat refresh, protoze by to nemelo vykon. Takze vydava nejak okrajove mobilni svaby, kde se na to zas tak nehraje a zaroven pripravuje i vetsi uarch zmeny, ktere budou kompenzovat nizsi startovaci frekvenci novych produktu.

V AMD nejsou hlupaci. Proc by do ZENu nedali 4 ALU, kdyz meli v K10 3ALU, v modulu BD 4ALU a za dobu vylepsovani stroju zlepsili predpovidani, cache, latence, atp. vse tak, ze v tuhle dobu uz 4 ALU na jadro uz davaji smysl. 6ALU ale rozhodne ne. To bude jeste dobu zbytecne.

Dokazes ty vubec pri svem nizkem IQ, ktere tady tak rad obnazujes, pochopit, ze mezi BD a ZEN je nakych 8 let vyvoje? A celou dobu zlepsovali ty ruzne subsystemy tak, ze 4 ALU jsou nyni uz relativne dobre zivene. Za nakych 8 let bude treba i tech 6 ALU dobre zivenych.

+1
+3
-1
Je komentář přínosný?

Ať ti z toho nepraskne žilka v mozku čéče :D
Svět by přišel o jednoho klauna, to by byla tuze škoda.

+1
-3
-1
Je komentář přínosný?

Coz to ja sem v pohode. Nemej strachy. S demenci se nesetkavam poprve.

S takovou tvrdohlavou demenci a snahou tu exhibovat evidentne mizerne znalosti a argumentacni schopnosti, to uz tak casto ne :)

Kazdopadne me mrzi a lituji te, ze vzdelavaci a lekarsky system v CR te tak hrozne sklamal.

+1
+2
-1
Je komentář přínosný?

Takže podle tebe Zen má 4xALU jen proto, že tam byly 2+2 v modulu a jim se to asi nechtělo mazat. Pane vachmajstr, voni jsou ale hlava. Odborník se pozná hned :D

Kdyby to napsal můj desetiletý syn, tak neřeknu. U dospělého jedince už to trošku zavání nedostatkem znalostí nebo lehkou mentální retardací.

Ale klidně se tu ztrapňuj dál a ukaž nám všem jak hluboko umíš klesnout...... :D

+1
-2
-1
Je komentář přínosný?

Paneboze, ty si sa fakt rozmnozil? :-O

+1
0
-1
Je komentář přínosný?

Clovece ty si uplny kreten. Uz prvy odsek je skvost. Ano, cache pamate maju funkciu ako si popisal, ale cache pamate maju niekolko dolezitych parametrov: latencie ci rychlost pristupu. A realtita je prave opacna ako si napisal: vypoctove jednotky nie su vyuzite na 100%, ani na 99,9 ani na 99%, pri beznom kode je to aj pod 90%. Proste nie je vyuzita komplet cela vypoctova sila fyzickeho jadra a vsetkleho kremika, kde by bol vyuzity kazdy elektron, kazdy cyklus cpu, kazdy zlomok nanosekundy. TO SA PROSTE NEDEJE !!! Ano, da sa napisat nejaky super-optimalizovany velmi nizko-urovnovy kod (napr. v assembleri) nasity na mieru patricnej architekture, ktory by vypoctovu silu jadra vyuzil na 99,998%, ale s najvacsou pravdepodobnostou to bude nezmyselna umelina optimalizovana na vyuzitie kazduckeho obvodu a kazduckeho cyklu v cpu danej architektury bez velkej praktickej pouzitelnoti. Bezne a prakticke programy vyuzivaju vypoctove moznostoi jadra na 90% ci aj menej (80%). Zbytok vykonu ked niektore ine jednotky nemaju co na praci sa mozu vyuzit pre druhe vlakno. Od toho existuje v pracakoch podpora HT/SMT.

Ty si akoze myslis, ze ked by dali do ZEN-u 8 ALU miesto 4 ALU a vsetko ostatne by nechali tak ako je, tak by IPC stuplo 2-nasobne?

+1
0
-1
Je komentář přínosný?

1) Neznas vsechny parametry procesu a vytvaris domnenky. Ekonomicky vyhodny process neznamena, dostatecne vykonny process. Na zaklade tve neznalosti a dojmu pak stavis ruzne vzdusne zamky. Prokopani 7nm EUV na relativne znamem navrhu cipu je cesta, jakou AMD kracelo velice casto. Neni duvod pouzivat jine varianty vyrobnich procesu.

Apple cipy behaji zhruba na polovicni frekvenci, nez Intel/AMD. To je velmi velky rozdil. Totiz krivka efektivity vyrobniho procesu neni linearni. Architekturu (pocet stage pipeline napr.) navrhuje pro konkretni frekvence. Kdyz takhle totalne zacloumas vyrobnim processem, tim padem frekvencemi, musis i rapidne prekopat architekturu. To ti vubec nedochazi.

2) To ze nekdo ma potrebu zminovat AVX512 ale zaroven nezmini SMT3+ je dost silna indikace, ze SMT3+ se nekona.

3) To ze nekdo dela na prvni "revolucni" architekture neznamena, ze kazde jeho angazovani znamena revolucni zmeny. Lidi nejsou stroje a nejde z nich zdimat revolucni skoky kazdy 3 roky. Takhle proste vyvoj (lidsky mozek) nefunguje.

4) Zmena jmena rodiny procesoru neznamena nutne tak zavaznou zmenu.

5) ALU nejsou vsechno. ALU je mala nejmensi jednotka delajici tu praci. Ale aby vykon CPU rostl, je potreba ji efektivne vyuzit. BD mel dve, protoze byl tak navrzen. Jednodussi navrh pocital s vyssimi frekvencemi, ktere se neporadilo dostat. Slozitejsi navrh (6ALU) potrebuje poradne tlustne zasobniky a cache, perfektni mechanizmy predpovedi, skvelou spravu pameti, nizke latence, atp. Apple si to muze dovolit spise, nez AMD/Intel proto, ze Apple ma pod palcem uplne cely ekosystem. On vydava HW, ovladac, jediny OS, ma pod palcem i aplikace. On muze vynutit ruznymi optimalizacemi ze i 6 ALU bude dobre vytizena. Na AMD bezi mrte OS, kazdy s jinou zakladni filozofii. Tuny ruznych aplikaci. Ruzne prekladace s ruznymi optimalizacemi.

+1
+3
-1
Je komentář přínosný?

Typický hater, tisíc výmluv proč něco nejde. Čoveče teby bych chtěl zaměstnávat.

ad 5) Pokud AMD nebo Intel neumí navrhnout 6xALU jádro a výkonově dohnat ten Apple, pak ať to rovnou zabalí, protože konkurence je tam pošle brzy tak jako tak. Můžou třeba prodávat rohlíky, to na snad budou mentálně zvládat.

+1
-4
-1
Je komentář přínosný?

Nemas poneni co je to hate :D

Ty tu delas uplne trapny hype, ktery nemas podlozeny absolutne nicim.

5) Ale oni hraji na uplne jinem hristi. 6ALU pro Intel nebo AMD neni zatim tak vyhodna, jako pro Apple. Kdyby mel moznost AMD diktovat si pouzity OS, tak by take treba presel na 6ALU. Nebo by mohl treba prejit i primo na RISC. Nebo by mohl prijit na IN-ORDER, ...

Proste a jednoduse, ty jsi magor, ktery nema ani paru o komplexnim systemu a provazani HW a SW. Kouknul jsi na najake video na YT a mas z toho zmatek v hlave.

Furt tu opakujes kouzelnou mantru o 6xALU na A13 a podporujes to vykonem v par ulohach na uzavrenem OS. ARM vs. x86, jeden iOS vs. ruzne Windows, Linux, Unix systemy je neco uplne jineho.

I ve svete x86 dokazes napsat tezce specializovanou aplikaci, ktera vydrti A13 uplne nahlavu. Jenze to budes muset svazat take s konkretnim prekladacem, kernelem, a konfiguraci zbytku masiny (RAM, SSD, atp.).

+1
+2
-1
Je komentář přínosný?

To jsou mi oslovení panečku, v jiném příspěvku "debil", teď "magor". Přestaň žít virtuální život u klávesnice a zkus zajít mezi lidi. On už ti někdo ručně vysvětlí co to je slušné chování. Až ti splasknou kontury do původního stavu, tak se ozvi ;-)

+1
-2
-1
Je komentář přínosný?

Kazdemu, co si zaslouzi :)

+1
+1
-1
Je komentář přínosný?

Jo za klávesnicí virtuální machr, ve skutečnosti ubožák co se bojí pozvat holku na rande. Takovej je plnej net :)

+1
-1
-1
Je komentář přínosný?

Hezky ses popsal...

+1
0
-1
Je komentář přínosný?

Ty jseš druhej takovej, takže se nedivím že ses ozval :D

+1
-2
-1
Je komentář přínosný?

"Dohnat apple" znamena, ze by amd s intelem museli snizit vykon svych cpu aby spadli na uroven apple. Proc by nekdo takovou blbost delal ? :o)

+1
+1
-1
Je komentář přínosný?

no právě, lidi nejsou stroje, někdy v nejnepravděpodobnějších situacích je napadají velmi kreativní řešení....
Ani to FX nebylo špatné, jen poněkud předběhlo dobu a své "odvedl" i ten strojový návrh.

+1
0
-1
Je komentář přínosný?

Zen3 = "Zen2+". Me libit. Ja chtit.

+1
0
-1
Je komentář přínosný?

2020 vypadá jako nákupní rok :D

+1
0
-1
Je komentář přínosný?

Už jsem někde psal můj odhad, že frekvenční strop bude 4,8-4,9GHz... Třeba to bude ale lepší, AMDčko se může (zatím) schválně držet při zemi :-)

+1
0
-1
Je komentář přínosný?

Ocekavani fanousku AMD byla od zacatku nerealna. Zen se povedl, o tom zadna, ale chcete po AMD, aby dělalo zázraky každý den, to je usmevne a nemozne.

+1
-8
-1
Je komentář přínosný?

Při porovnání s pokrokem konkurence, která na IPC přidá 5%, aby následně zalátáním nějaké škaredé díry 10% ubrala, je tohle od AMD naprostá pecka.

+1
+17
-1
Je komentář přínosný?

+

+1
+2
-1
Je komentář přínosný?

Každý den ne ale co udělalo AMD v procesorech za posledních pár let je víc než co udělal Intel za posledních 10.

+1
+17
-1
Je komentář přínosný?

Nejvíc Šalamounské bylo jeden identický malý chiplet s dobrou výtěžností, u kterého se dají použít i "zmetky" na kterém AMD postavilo celé portfolio :D Ještě to APUčko to chce do komplet rodiny

+1
+4
-1
Je komentář přínosný?

zazrak uz nastal, uspech zen2 si nemohl nikdo pred 5ti lety ani predstavovat, zejmena co se EPYC ROME tyka, to je naprosty ulet

+1
+8
-1
Je komentář přínosný?

Pro mne jiz Zen 2 dokazal veliky skok, prinesl 65 wattovy Ryzen 7 3700X ktery se rovna vykonu nenazranejsiho jak energeticky tak cenove modelu Core i9 - 9900K, dale za nim prisel 65 wattovy dvanactijaderny Ryzen 9 3900, naprosto neuveritelne, myslim ze Zen 3 udela jeste vic 65W procesoru tak soucasne 65W snizi na hodnotu 45-55 wattu, jednoduse pujde hlavne po efektivnosti, dale jiste stoupne IPC ale to veci sjednocene cache, tez si myslim ze AMD uvede 5GHz ceresnicku na dort v podobe 8 jaderneho modelu, neco na zpusob Ryzen 7 2700X jen to bude model 4700X. Ryzen-y 4000 budou jako posledni pasovat do soucasneho socketu AM4 alias DDR4 cimz AMD splni slib kompatibility platformy.

+1
+1
-1
Je komentář přínosný?

Aritmeticko logicka jednotka a jeji uloha ve spolecnosti... ehm procesoru.

Toto povidani je hlavne pro Richie Rich a dalsi demagogicke magory, kteri veri, ze vice ALU = vice Adidas.

Snazim se to zjednodusit, pokud udelam chybu, muze to byt az moc velkou snahou, nebo muzu mit opravdu spatne info, takze me kdyztak prosim upozornete a opravte :)

1) Neni ALU jako ALU
Aritmeticko logicka jednotka si jako skoro kazda cast CPU prosla nejakym vyvojem. V poslednich inkarnacich ale neni kazda jednotka co se tyce efektivity zpracovani instrukci stejne jako ostatni. ALU jednotky jsou totiz napojeny na porty bazenu (pool, nekdy oznacovany jako "reserve station") instrukci. Instrukce do toho bazenu hazi scheduler - nekdy se to kresli ve schematu jako jeden blok. Zakladni A-L operace by meli zvladat kazda stejne. Ale jsou i specialni instrukce jako posuny (shift), nebo nahrani efektivni adresy (LEA), ktere jsou specialne optimalizovane, ale ne kazda jednotka na kazdem portu umi stejne dobre vsechny sady instrukci. To, co nekteri mylne berou jen za ALU uz davno neni jeden univerzalni blok tranzistoru, takze jednoduche zvyseni jejich poctu se nemuze nikdy uplne jednoduse pretvorit na vyssi IPC v rozmanitych aplikacich.

2) Neni instrukce jako instrukce. ALU dokazi zpracovat jen nektere z instrukci a zaroven pro svou maximalni efektivnitu ale potrebuji mit vse pripravene. Zadny kod neni ciste jen o ALU instrukcich, takze zvyseni poctu ALU se nikdy nemuze uplne jednoduse pretvorit na vyssi IPC v beznych aplikacich.

3) Kazda ALU znamena TEORETICKY +1 IPC. Tzn. ze 6 ALU !teoreticky! znamena 6IPC. Kdyz vite kolik mate cyklu muzete si porovnavat teoreticke e-pindiky na papire. Bohuzel ALU jsou dost casto tragicky nevytizene (duvod proc se zavedl napr. HyperThreading). Kdyz se spatne predpovi kod, neni v bazenu instrukci zadna na zpracovani. Kdyz nejsou vsechny adresy vypocitane, nevi se, co kde jsou veci na pocitani. Kdyz nejsou instrukce dekodovane, tak se nevi co se ma pocitat. Kdyz... Zkratka a dobre, samostatny vyssi pocet ALU nejde jednoduse pretvorit na vyssi IPC.

Jestli me pamet neklame, tak AMD vydalo k Bulldozeru jejich vlastni propocty, ze jadro prechazejicich Athlonu melo vrchol realnych IPC lehce pres 2 (K10 mela 3ALU+3AGU). Proto AMD nenavrhovalo bulldozer s 4ALU na jadro. Ale 4 ALU na modul (vlastne specificka verze SMT). Problem byl, ze dalsi prvky nedokazaly vyuzit plne zaukolovat tehle 4 ALU na modul a vykon byl tragicky. Pocet ALU jako takovy za to ale uplne nemohl. Kdyby to vse dopadlo ruzove pro AMD, tak by byl vykon 4moduloveho (jakoby 8 jadroveho) Bulldozeru dost konkurence-schopny i pro stavajici 4C8T CPU od Intelu.

Je hrozne dulezite si uvedomit, ze nez zacnete pumpovat vice ALU do jadra, musite je mit cim krmit. Takze musite mit skvele analyzy kodu, ktery vase CPU chroupa. Jake instrukce tudy lezou, jak casto se opakuji v kodech. A mnohem jednodussi je to udelat, kdyz mate cely ekosystem E2E pod palcem jako Apple. Apple dela navrh HW, Apple pro nej ma ovladac, Apple vi presne jaky OS na nem bezi a sam ho dela(optimalizuje) a Apple zaroven kontroluje prekladace a i applikace (muze vam zamitnout appku, ktera by skrze nejake specialni operace rozpalila iPhone dobela). Kdyz Apple jde do 6 ALU, dava to pro Apple system smysl. Nejde to ale brat tak, ze je prukopnikem a ostatni jsou salati, ze na to jeste neprisli, nebo neschopni, ze to jeste neimplementovali.

AMD ani Intel takovyhle super system bohudik nemaji. I z te analyzy AMD, kde vychazelo neco kolem 2IPC se ale da vytusit, ze jsou prostory pro zlepseni aniz by se mnozili ALU jednotky. At uz software (prekladace) nebo hardware, system ruznych cache, predpovidani vetveni, mensi prodlevy, atp.

Drive ci pozdeji se 6+ ALU dockame i u AMD a Intelu, ale porad je hrozne velky nevyuzity potencial jinde. ALU nejdou uplne podtaktovat (i kdyz jsou pripady architektury, kde ALU bezeli na jine frekvencni domene), kdyz AGU chroupaji pamet, nebo se vyprazdnuji cache, kdyz se kod vyda jinou cestou, atp., takze mit tam 6 hladovych krku, ktere porad vriskaji neni energeticky efektivni.

+1
+6
-1
Je komentář přínosný?

Mimochodem, zamysleli jste se nekdy nad "single thread" testy?

Jediny zpusob jak to skutecne otestovat je zakazat pristup na nejake konkretni jadro celemu OS i vsem -az na jedinou- aplikacim. A u te jedine naopak nastavit, ze musi bezet jen na tom konkretnim jadre.

Zaroven musite vypnout SMT. Pak muzete zjistit skutecny ST vykon a IPC v dane aplikaci.

Takhle se ale prilis casto netestuje. NAVIC i tak muze byt ten vykon ovlivnen multi-taskingem. Protoze i tak muze byt to jadro negativne ovlivnene cekanim nez se naplni spolecna cache, atp... takze vlastne u AMD asi jen tak, ze vyradite jeden cely CCD exkluzivne jen pro jednu aplikaci. Nevim jak by se to dalo zaridit u Intelu :)

+1
+1
-1
Je komentář přínosný?

Ty si dokážeš i sám odpovídat. Ty seš fakt pacient :-D

Zkus teda napsat do Applu že jsou úplní pitomci s těma jejich 6xALU a že jim poradíš jak udělat 2xALU výkonnější než ten jejich 6xALU stroj. A dej vědět jaks dopadl.

A ne že se pak odmlčíš, bez tebe by tu nebyla sranda :)

+1
-3
-1
Je komentář přínosný?

Furt tu onanujes nad 6xalu u apple a naprosto ignorujes fakt, ze ten apple ma vykon jak 4 roky stary x86 generace skylake. Ze je dneska x86 naprosto bezne nekolikrat vykonejsi nez ten armovsky zazrak...

+1
+2
-1
Je komentář přínosný?

Pekne napisane. A keby tam aj boli nejake chybky, podstata zostava.
Je dobre rozmyslat aj v kontexte doby - kazde zvysovanie efektivity (vyuzitia) ALU ci FPU jednotiek stoji tranzistory a obvykle naroky stupaju exponencialne. Davnejsie, ked zvysovat frekvencie nebolo az tak tazke, sa islo hlavne tou cestou spolu s rozsirovanim jadier. Dnes, ked s novymi procesmi frekvencie stupaju minimalne, ale nastastie pocet tranzistorov na jednotku plochy stale narasta, vyrobcovia musia prichadzat s "tucnejsimi" jadrami pre zvysenie IPC a zvysovanim poctu jadier. Je iste, ze AMD aj Intel s "tucnejsimi" jadrami pridu tiez, nech je tam ALU kolkokolvek a zase odskocia ARMu o kus dalej.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.