Diskuse k OpenPOWER summit: otevřená ISA a nový stroj od Raptoru

6xALU Apple A13 | 23. 8. 2019 - 14:47

x86 zanikne. Budoucnost patří RiSC-V, OpenPower nebo ARMu.
Zatím nejvýkonnější CPU na světě je Vortex se 6xALU, což je ARM vyvinutý Apple pro iPhony.

EETagent | 23. 8. 2019 - 19:17

No to určitě. Nepopírám schopnosti Poweru, ale byla to právě tahle architektura, která byla z consumer PC sféry vytlačena a od té doby nevidím výrazný pokrok. RISC-V v dohledné době určitě ne, pro ten vidím místo hlavně v menších čipech. A ARM? Ten těžko, jeho výhoda spotřeby vyniká hlavně v nižších TDP.

A jsou to právě x86, které jedou. viz. Zen2, snad i Ice Lake.

A s tou A12, na to jsi přišel jako kde? Nějaký důkaz, který by tvé tvrzení potvrdil?

Tom | 23. 8. 2019 - 19:21

ona ta A12 má ASIC obvody a v některých úlohách díky tomu exceluje se směšně nízkou spotřebou :)

Czech Human | 23. 8. 2019 - 19:39

No tak hned jak se CPU budou běžně vyrábět jako dynamicky inteligentně se reorganizující hradlová pole se dá mluvit o konci "rigidní" x86 a nástupu něčeho fluentního podle potřeby ale do té doby se o tom myslím dá dost pochybovat :-).

bwpow | 23. 8. 2019 - 22:26

Ja vidim buducnost v zmiesanych chipoch, kde budu velke x86 jadra a k tomu niekolko malych A72+A53+ASIC jadier, ktore ale budu normalne pristupne pre OS. Na nich by mohli bezat napriklad network stack, firewall, rozne sietove protokoly a dalsia rezia. Velke jadra by potom obsluhovali uz samotne plnotucne aplikacie, ktore potrebuju vykon. Tie by tym padom mohli uplne spat, kym by neboli potrebne.

Ked sa uz dnes bezne pouziva little+BIG, tak preco by nemohlo byt aj little+BIG+SHIT?

r23 | 23. 8. 2019 - 23:02

Problem spis je ze i kdyz mama super vykonne procesory, typicky na nich bezi interpretovany BIG SHIT.
Dokud se toto nevyresi, nejake reseni se specializovanymi jadry nema moc smysl.

6xALU Apple A13 | 23. 8. 2019 - 23:49

Máte rozbor na Anandtechu: https://www.anandtech.com/show/13392/the-iphone-xs-xs-max-review-unveili...

"Apple’s microarchitecture seems to far surpass anything else in terms of width, including desktop CPUs"

"Monsoon (A11) and Vortex (A12) are extremely wide machines – with 6 integer execution pipelines among which two are complex units, two load/store units, two branch ports, and three FP/vector pipelines this gives an estimated 13 execution ports, far wider than Arm’s upcoming Cortex A76 and also wider than Samsung’s M3."

Pro srovnání: IceLake i Zen2 mají jen 4 ALU jednotky. Teoreticky by A12 díky 6xALU měla mít o 50% větší IPC, ale ve skutečnosti má +76% větší IPC nad Skylake ve SPECint2006. Taky jsem na to valil bulvy, ale je to tak.

r23 | 24. 8. 2019 - 00:08

O tohle ale vubec nejde, jde o to, jak je napsany bezny aplikacni sw. Ten to zabiji...

6xALU Apple A13 | 24. 8. 2019 - 13:49

Jako uživatel Androidu jsem tak trochu nasraný že si nemůžu koupit telefon s tímto CPU.

1) Starý benchmark SPEC z roku 2006 ... stejné algoritmy pro všechny CPU a všechny platformy. Proto se používá v profi server světě pro srovnání. Ta A12 Vortex běží suprově i na starém benchmarku. V nových věcech to bude ještě rychlejší.

2) Přidat ALU jednotky je naopak to nejsložitější. Jak dlouho trvalo než AMD přešlo ze 3ALU (K7, K8, K10) na 4ALU Zen jádro? 1999 - 2017 Zen... 18 let pánové. Překopat celé OoO na více ALU = komplet nové jádro -> k tomu je třeba nový front-ent, dekodéry patřičně široké aby to stíhaly krmit, prostě začít s vývojem komplet od začátku. Bavíme se tady o nějakých cca 200 milionů tranzistorů na jádro, to není sranda. Copy-paste přidávat další jádra je daleko jednodušší.

3) Až s tím vlítne Apple do notebooků a desktopu, tak bude většina lidí překvapena že to je rychlejší i včetně emulace x86 kódu. A že Apple plánuje přechod od Intelu na svůj vlastní ARM je hotová věc. A z jejich pohledu se jim nedivím, když mají nejrychlejší CPU. Vemte si že dle toho Anandtechu ta A12 má 2x větší výkon/watt než Cortex A76, jinými slovy má spotřebu 4.2W při 2.5GHz a výkon má jako Intel Skylake 4.0GHz. Ten iBook bude mít 2x menší baterii a tedy 2x levnější a zároveň bude mít 2x-3x větší výdrž než Intelinside. Proto má Apple tak brutální marže. Investuje masivně do promyšlené konstrukce a pak ušetří obrovské peníze na materiálu. Chytrý přístup.

Jako uživatel Androidu jsem

6xALU Apple A13 https://diit.cz/profil/richard-broda

24. 8. 2019 - 13:49 https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse Jako uživatel Androidu jsem tak trochu nasraný že si nemůžu koupit telefon s tímto CPU. 1) Starý benchmark SPEC z roku 2006 ... stejné algoritmy pro všechny CPU a všechny platformy. Proto se používá v profi server světě pro srovnání. Ta A12 Vortex běží suprově i na starém benchmarku. V nových věcech to bude ještě rychlejší. 2) Přidat ALU jednotky je naopak to nejsložitější. Jak dlouho trvalo než AMD přešlo ze 3ALU (K7, K8, K10) na 4ALU Zen jádro? 1999 - 2017 Zen... 18 let pánové. Překopat celé OoO na více ALU = komplet nové jádro -> k tomu je třeba nový front-ent, dekodéry patřičně široké aby to stíhaly krmit, prostě začít s vývojem komplet od začátku. Bavíme se tady o nějakých cca 200 milionů tranzistorů na jádro, to není sranda. Copy-paste přidávat další jádra je daleko jednodušší. 3) Až s tím vlítne Apple do notebooků a desktopu, tak bude většina lidí překvapena že to je rychlejší i včetně emulace x86 kódu. A že Apple plánuje přechod od Intelu na svůj vlastní ARM je hotová věc. A z jejich pohledu se jim nedivím, když mají nejrychlejší CPU. Vemte si že dle toho Anandtechu ta A12 má 2x větší výkon/watt než Cortex A76, jinými slovy má spotřebu 4.2W při 2.5GHz a výkon má jako Intel Skylake 4.0GHz. Ten iBook bude mít 2x menší baterii a tedy 2x levnější a zároveň bude mít 2x-3x větší výdrž než Intelinside. Proto má Apple tak brutální marže. Investuje masivně do promyšlené konstrukce a pak ušetří obrovské peníze na materiálu. Chytrý přístup. https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse#comment-1267322 +

Puf a Muf | 24. 8. 2019 - 19:56

"Vemte si že dle toho Anandtechu ta A12 má 2x větší výkon/watt než Cortex A76"

Tohle vůbec není pravda, nebo aspoň váš odkaz nic takového neukazuje, pokud jsme něco npřehlédl. Pozdější měření AnandTechu naopak ukazuje, že A12 je sice o dost rychlejší, ale taky má při tom o dost větší příkon, takže poměr perofrmance per watt se vlastně nezlepšuje.

https://images.anandtech.com/doci/13614/SPEC-perf-eff-overview-November_...
https://www.anandtech.com/show/13614/arm-delivers-on-cortex-a76-promises

Podívejte se na údaj "joules", to říká, kolik energie se na výpočet nakonec spotřebovalo (bez ohledu na to, kolik trval). U Cortexu-A76 je ta hodnota nižší, tj, za stejnou práci sežral méně. Ono je asi celkově zajímavější to jádro Applu, protože má tu sežranou energii ne o moc horší, ale je přitom o dost rychlejší (ale zase kvůli těm špičkovým příkonům přes 4 W se pak zase dějí takové ty zpomalovací aktualizace, aby se telefon s ojetější baterií neyvpínal...). Ale když mluvíme o poměru výkonu a a potřeby, tak to je něco jiného, než absolutní výkon.

BTW taky ten výkon A12 se musí brát v kontextu toho, že je dělaný na nízké frekvence v mobilu, takže si může dovolit optimalizace, které design pro vyšší frekvence ne. Procesor s 2x IPC, který ale dosáhne jenom poloviční frekvence, není nějaká super výhra proti polovičnímu IPC/2x taktu. Výkon nakonec stejný.

"Ten iBook bude mít 2x menší baterii a tedy 2x levnější"

Apple nechá cenu pro vás stejnou :)

"a zároveň bude mít 2x-3x větší výdrž než Intelinside."

To nejspíš ne, protože výdrž se neodvíjí od výkonu a efektivity jader CPU, ale od toho zbytku SoC. Zlepšení může nastat, pokud ten Applí Soc bude ke všemu mít tak nějak telefonní přístup a řešení, ale on zase Intel má v noteboocích tu idle spotřebu taky dost dobrou a pokračuje v jejím pilování.
No ale hlavně se pak v laptopu stane největším žroutem energie při práci displej, takže se pak 2-3x delší výdrž baterky se třeba ani udělat nedá, se stejným panelem. Proc prostě už nebere tolik energie, aby ten rozdíl vytvořil, i kdyby měl spotřebu úplně nulovou. Navíc když tvrdíte, že baterka bude 2x menší...

"Vemte si že dle toho

Puf a Muf https://diit.cz/profil/jan-olsan

24. 8. 2019 - 19:56 https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse "Vemte si že dle toho Anandtechu ta A12 má 2x větší výkon/watt než Cortex A76" Tohle vůbec není pravda, nebo aspoň váš odkaz nic takového neukazuje, pokud jsme něco npřehlédl. Pozdější měření AnandTechu naopak ukazuje, že A12 je sice o dost rychlejší, ale taky má při tom o dost větší příkon, takže poměr perofrmance per watt se vlastně nezlepšuje. https://images.anandtech.com/doci/13614/SPEC-perf-eff-overview-November_575px.png https://www.anandtech.com/show/13614/arm-delivers-on-cortex-a76-promises Podívejte se na údaj "joules", to říká, kolik energie se na výpočet nakonec spotřebovalo (bez ohledu na to, kolik trval). U Cortexu-A76 je ta hodnota nižší, tj, za stejnou práci sežral méně. Ono je asi celkově zajímavější to jádro Applu, protože má tu sežranou energii ne o moc horší, ale je přitom o dost rychlejší (ale zase kvůli těm špičkovým příkonům přes 4 W se pak zase dějí takové ty zpomalovací aktualizace, aby se telefon s ojetější baterií neyvpínal...). Ale když mluvíme o poměru výkonu a a potřeby, tak to je něco jiného, než absolutní výkon. BTW taky ten výkon A12 se musí brát v kontextu toho, že je dělaný na nízké frekvence v mobilu, takže si může dovolit optimalizace, které design pro vyšší frekvence ne. Procesor s 2x IPC, který ale dosáhne jenom poloviční frekvence, není nějaká super výhra proti polovičnímu IPC/2x taktu. Výkon nakonec stejný. "Ten iBook bude mít 2x menší baterii a tedy 2x levnější" Apple nechá cenu pro vás stejnou :) "a zároveň bude mít 2x-3x větší výdrž než Intelinside." To nejspíš ne, protože výdrž se neodvíjí od výkonu a efektivity jader CPU, ale od toho zbytku SoC. Zlepšení může nastat, pokud ten Applí Soc bude ke všemu mít tak nějak telefonní přístup a řešení, ale on zase Intel má v noteboocích tu idle spotřebu taky dost dobrou a pokračuje v jejím pilování. No ale hlavně se pak v laptopu stane největším žroutem energie při práci displej, takže se pak 2-3x delší výdrž baterky se třeba ani udělat nedá, se stejným panelem. Proc prostě už nebere tolik energie, aby ten rozdíl vytvořil, i kdyby měl spotřebu úplně nulovou. Navíc když tvrdíte, že baterka bude 2x menší... https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse#comment-1267324 +

6xALU Apple A13 | 25. 8. 2019 - 16:58

Exynos 9810 je dvakrát horší jak jsem psal. Ten Kirin 980... nesouhlasím že je na tom stejně, spotřeba energie 9521 proti 9480 je rozdíl prakticky 0.4% a což bude blízko chyby samotného měřáku.

"BTW taky ten výkon A12 se musí brát v kontextu toho, že je dělaný na nízké frekvence v mobilu, takže si může dovolit optimalizace, které design pro vyšší frekvence ne. Procesor s 2x IPC, který ale dosáhne jenom poloviční frekvence, není nějaká super výhra proti polovičnímu IPC/2x taktu. Výkon nakonec stejný."

Tímto jsi se degradoval na naprostou lopatu co tomu moc nerozumí. Kdyby ano pak víš, že:

1) frekvence jsou dány kritickou cestou jedntlivých stage v pipeline (tedy nesouvisí se šířkou/IPC). Proto AMD K6 (2ALU CPU) končila na 500Mhz a třeba AMD Bulldozer (také 2ALU) šel až na 5GHz, tedy 10x tolik. Redaktor magu a nemá základní znalosti jak funguje CPU, ach jo.

2) přidat 2 ALU a udělat 6ALU jádro není jen "optimalizace", ale naprosto nový design jádra jaký nemá zatím ve světě IT obdoby. Jak jsem již psal AMD trvalo přejít z 3ALU K7 na 4ALU Zen 18 let, Intelu to trvalo z P3 1999 na Haswell 2013, celých 14 let. Tady pro místního redaktora je to jen nízkofrekvenční optimalizace, a korunuje to největší hloupostí typu "2xIPC vyjde nastejno jako 2xfrekvence". Panebože proč mi to děláš? K8 vs. P4, Sandybridge vs. Bulldozer, říká vám to vůbec něco?

3) Pak tu máme křivku frekvencí vs. napětí, kterou má každý CPU. Třeba Cortex A76 dokáže běžet na 2.5GHz @ 0.7V (kolem 2W) ale i na 4.0GHz @1.3V (8W+). Ta A12 také může běžet na 4GHz, samozřejmě ne v telefonu. Jediný problém je její paměťový subsystém - pro větší frekvence by potřebovala nejspíš větší buffery, protože sice jádro běží rychleji, ale rychlost RAM zůstává stejná.

4) Jsou dvě skupiny lidí:
4.1) ta první jsou odborníci z Anandtechu, kteří měří výkon/J a spoustu jiných podrobností o němž se českým e-zinům ani nesnilo, nikoliv náhodou z USA, tedy země kde probíhá vývoj všech CPU... a ti se shodli že ta A12 je opravdu vyjímečný kus CPU
4.2) ta druhá jsou nýmandi z ČR, země která nemá s vývojem CPU vůbec nic společného a jejíž redaktoři zdaleka nemají ani poloviční znalosti Anandtechu.... a ti tvrdí že "není nějaká super výhra proti polovičnímu IPC/2x taktu. Výkon nakonec stejný."

Hrdě se hlásím k té první skupině. Rozhodně se ztotožňuji s hodnocením odborníků na Anandtechu než s panem Olšanem.

Exynos 9810 je dvakrát horší

6xALU Apple A13 https://diit.cz/profil/richard-broda

25. 8. 2019 - 16:58 https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse Exynos 9810 je dvakrát horší jak jsem psal. Ten Kirin 980... nesouhlasím že je na tom stejně, spotřeba energie 9521 proti 9480 je rozdíl prakticky 0.4% a což bude blízko chyby samotného měřáku. "BTW taky ten výkon A12 se musí brát v kontextu toho, že je dělaný na nízké frekvence v mobilu, takže si může dovolit optimalizace, které design pro vyšší frekvence ne. Procesor s 2x IPC, který ale dosáhne jenom poloviční frekvence, není nějaká super výhra proti polovičnímu IPC/2x taktu. Výkon nakonec stejný." Tímto jsi se degradoval na naprostou lopatu co tomu moc nerozumí. Kdyby ano pak víš, že: 1) frekvence jsou dány kritickou cestou jedntlivých stage v pipeline (tedy nesouvisí se šířkou/IPC). Proto AMD K6 (2ALU CPU) končila na 500Mhz a třeba AMD Bulldozer (také 2ALU) šel až na 5GHz, tedy 10x tolik. Redaktor magu a nemá základní znalosti jak funguje CPU, ach jo. 2) přidat 2 ALU a udělat 6ALU jádro není jen "optimalizace", ale naprosto nový design jádra jaký nemá zatím ve světě IT obdoby. Jak jsem již psal AMD trvalo přejít z 3ALU K7 na 4ALU Zen 18 let, Intelu to trvalo z P3 1999 na Haswell 2013, celých 14 let. Tady pro místního redaktora je to jen nízkofrekvenční optimalizace, a korunuje to největší hloupostí typu "2xIPC vyjde nastejno jako 2xfrekvence". Panebože proč mi to děláš? K8 vs. P4, Sandybridge vs. Bulldozer, říká vám to vůbec něco? 3) Pak tu máme křivku frekvencí vs. napětí, kterou má každý CPU. Třeba Cortex A76 dokáže běžet na 2.5GHz @ 0.7V (kolem 2W) ale i na 4.0GHz @1.3V (8W+). Ta A12 také může běžet na 4GHz, samozřejmě ne v telefonu. Jediný problém je její paměťový subsystém - pro větší frekvence by potřebovala nejspíš větší buffery, protože sice jádro běží rychleji, ale rychlost RAM zůstává stejná. 4) Jsou dvě skupiny lidí: 4.1) ta první jsou odborníci z Anandtechu, kteří měří výkon/J a spoustu jiných podrobností o němž se českým e-zinům ani nesnilo, nikoliv náhodou z USA, tedy země kde probíhá vývoj všech CPU... a ti se shodli že ta A12 je opravdu vyjímečný kus CPU 4.2) ta druhá jsou nýmandi z ČR, země která nemá s vývojem CPU vůbec nic společného a jejíž redaktoři zdaleka nemají ani poloviční znalosti Anandtechu.... a ti tvrdí že "není nějaká super výhra proti polovičnímu IPC/2x taktu. Výkon nakonec stejný." Hrdě se hlásím k té první skupině. Rozhodně se ztotožňuji s hodnocením odborníků na Anandtechu než s panem Olšanem. https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse#comment-1267353 +

Mirda Červíček | 25. 8. 2019 - 17:12

„nikoliv náhodou z USA, tedy země kde probíhá vývoj všech CPU"

Kromě hrdosti bys měl zapracovat i na informovanosti. Ostatní tvoje téměř náboženské řeči jsou také k smíchu - třeba ti je nějaký dobrák-aktivista vyvrátí. Stručně - věřit, že Apple je o tolik lepší než všichni ostatní a zároveň toho nijak nevyužívá na trzích, kde by měl ještě větší marže než na předražených konzumních cetkách.....to je hloupost.

6xALU Apple A13 | 25. 8. 2019 - 17:28

Jsem uživatel droidu, apple jsem nikdy nevlastnil a ani nechci. Nejsem frikulin s ajfonem.

Ale z technického hlediska je ten CPU prostě unikát a dost dobře ukazuje kam se bude ubírat vývoj Intelu i AMD v blízké budoucnosti. To je vše. Nechápu že přes antipatie k Applu lidi nechtějí vidět ten skok v konstrukci CPU. Osobně Apple rád nemám, ale tohle dokážu ocenit.

Jinak Apple toho chce využít tak, že nahradí Intel v noteboocích a desktopech. Spekulace říkají že je to jasná věc. Z desktopu do serveru už je to jenom kousek, takže kdo ví....aby se kluci v Intelu za 2 roky nedivili.

Mirda Červíček | 25. 8. 2019 - 21:20

Kéž by, jakákoliv konkurence jeho arogantnímu chování a zneužívání pozice na trhu je vítána. Tak za 2 roky uvidíme - 7 nm s novou architekturou vs Apple ARM (snad už aspoň v notebooku s výhledem na budoucí desktop).

Puf a Muf | 25. 8. 2019 - 17:59

"ta první jsou odborníci z Anandtechu"
A ti odborníci z AnandTechu naměřili, že na stejnou práci potřebuje Cortex-A76 míň joulů než A12. To je, co jsem psal. Nikde jsem nepsal, že A12 není dobrej, naopak jsem napsal, že díky vyššímu výkonu je nakonec určitě zajímavější.

Holt jste prostě kecal, že má Cortex-A76 2x horší poměr výkon/spotřeba, a to prostě není pravda, protože sežere míň joulů. A12 žere v specfp 4,27 W tam, kde A76ka jenom 2,65 W, a rozdíl ve výkonu je těsně nižší, než rozdíl v příkonu.
Podle vašeho AnandTechu. Tak proč štěkáte na mě? Buď jděte nadávat jim, nebo se holt smiřte s tím, že ten předmětnej výrok neměl pravdu.

"frekvence jsou dány kritickou cestou jednotlivých stage v pipeline (tedy nesouvisí se šířkou/IPC)."
Teoreticky ne, ale jedno jde s druhým, to zvyšování IPC právě často vede k tomu, že kritická cesta sníží dosažitelnou frekvenci. Vy to zřejmě ignorujete a to je ta chyba. Tomu se třeba Intel Skylake nebo i ten Zen 2 musí při návrhu vyhýbat, kdežto Apple si takovej kompromis může dovolit a třeba cache mu zdaleka nemusí zvládat tak vysoké takty.

"Proto AMD K6 (2ALU CPU) končila na 500Mhz a třeba AMD Bulldozer (také 2ALU) šel až na 5GHz, tedy 10x tolik."
To jste trošku vedle, protože ten rozdíl je ve dvou věcech - v hloubce pipeline, ale také na procesu, protože K6ka se stala o dost dřív než se narazilo na tzv. "frequency wall". Fakt budeme ignorovat, že K6ka se dělala na 350nm až 180nm bulk procesu (jenom úplně poslední revize), kdežto Bulldozer na 32nm procesu, SOI? A já sem jako lopata :)
A ta první věc, pipeline, je taky zásadní důvod, ale K6 není dobrej příklad, ta měla na dnešní poměry hrozně krátkou pipeline, snad jenom 6 stupňů, nebo tak něco. To mají dnes spíš taková embeded jádra...
Pro ilustraci, na tom 180nm procesu se K7 dostal na 1733 MHz - to je asi lepší příklad, protože ten měl mainstremovější hloubku (i když na dnešní poměry krátkou). Bulldozer měl delší, ale ne extrémně, kratší než P4 Northwood, IIRC. Jádro K10, které mělo podobnou na dnešní dobu relativně krátkou pipeline jako K8 (nebylo to nějak 12 stupňů? měla o 2 stupňě víc než K7) se na 45nm procesu dostalo na 3,7 GHz, takže ne zas tak o moc níž než ten Bulldozer. K8 se na 90nm procesu dostala na 3,2 GHz.
Každopádně Těch víc ALU ale určitě taky může vést k tomu drastičtějšímu omezení danému kritickou cestou. Ten paralelismus a Out-of-order s větším počtem jednotek má svoje ceny. Když musíte jet na 4,5 GHz, tak máte mnohem komplikovanější to přidání dalších jednotek do toho schématu, než když vaše cíle říkají, že je naprosto OK, když skončíte na 2,8 GHz.

"Tady pro místního redaktora je to jen nízkofrekvenční optimalizace"
O počtu ALU jsem já nemluvil.

"2xIPC vyjde nastejno jako 2xfrekvence"
A proč myslíte, že není? Ta vyšší frekvence typicky bude mít nevýhodu ve větší spotřebě (i když to tak teoreticyk nemusí vyjít vždycky), ale to vyšší IPC zase může stát větší plochu na čipu. A když je výkon stejnej...

"Ta A12 také může běžet na 4GHz, samozřejmě ne v telefonu."
Toto tvrdíte na základě čeho?

"ta první jsou odborníci z

Puf a Muf https://diit.cz/profil/jan-olsan

25. 8. 2019 - 17:59 https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse "ta první jsou odborníci z Anandtechu" A ti odborníci z AnandTechu naměřili, že na stejnou práci potřebuje Cortex-A76 míň joulů než A12. To je, co jsem psal. Nikde jsem nepsal, že A12 není dobrej, naopak jsem napsal, že díky vyššímu výkonu je nakonec určitě zajímavější. Holt jste prostě kecal, že má Cortex-A76 2x horší poměr výkon/spotřeba, a to prostě není pravda, protože sežere míň joulů. A12 žere v specfp 4,27 W tam, kde A76ka jenom 2,65 W, a rozdíl ve výkonu je těsně nižší, než rozdíl v příkonu. Podle vašeho AnandTechu. Tak proč štěkáte na mě? Buď jděte nadávat jim, nebo se holt smiřte s tím, že ten předmětnej výrok neměl pravdu. "frekvence jsou dány kritickou cestou jednotlivých stage v pipeline (tedy nesouvisí se šířkou/IPC)." Teoreticky ne, ale jedno jde s druhým, to zvyšování IPC právě často vede k tomu, že kritická cesta sníží dosažitelnou frekvenci. Vy to zřejmě ignorujete a to je ta chyba. Tomu se třeba Intel Skylake nebo i ten Zen 2 musí při návrhu vyhýbat, kdežto Apple si takovej kompromis může dovolit a třeba cache mu zdaleka nemusí zvládat tak vysoké takty. "Proto AMD K6 (2ALU CPU) končila na 500Mhz a třeba AMD Bulldozer (také 2ALU) šel až na 5GHz, tedy 10x tolik." To jste trošku vedle, protože ten rozdíl je ve dvou věcech - v hloubce pipeline, ale také na procesu, protože K6ka se stala o dost dřív než se narazilo na tzv. "frequency wall". Fakt budeme ignorovat, že K6ka se dělala na 350nm až 180nm bulk procesu (jenom úplně poslední revize), kdežto Bulldozer na 32nm procesu, SOI? A já sem jako lopata :) A ta první věc, pipeline, je taky zásadní důvod, ale K6 není dobrej příklad, ta měla na dnešní poměry hrozně krátkou pipeline, snad jenom 6 stupňů, nebo tak něco. To mají dnes spíš taková embeded jádra... Pro ilustraci, na tom 180nm procesu se K7 dostal na 1733 MHz - to je asi lepší příklad, protože ten měl mainstremovější hloubku (i když na dnešní poměry krátkou). Bulldozer měl delší, ale ne extrémně, kratší než P4 Northwood, IIRC. Jádro K10, které mělo podobnou na dnešní dobu relativně krátkou pipeline jako K8 (nebylo to nějak 12 stupňů? měla o 2 stupňě víc než K7) se na 45nm procesu dostalo na 3,7 GHz, takže ne zas tak o moc níž než ten Bulldozer. K8 se na 90nm procesu dostala na 3,2 GHz. Každopádně Těch víc ALU ale určitě taky může vést k tomu drastičtějšímu omezení danému kritickou cestou. Ten paralelismus a Out-of-order s větším počtem jednotek má svoje ceny. Když musíte jet na 4,5 GHz, tak máte mnohem komplikovanější to přidání dalších jednotek do toho schématu, než když vaše cíle říkají, že je naprosto OK, když skončíte na 2,8 GHz. "Tady pro místního redaktora je to jen nízkofrekvenční optimalizace" O počtu ALU jsem já nemluvil. "2xIPC vyjde nastejno jako 2xfrekvence" A proč myslíte, že není? Ta vyšší frekvence typicky bude mít nevýhodu ve větší spotřebě (i když to tak teoreticyk nemusí vyjít vždycky), ale to vyšší IPC zase může stát větší plochu na čipu. A když je výkon stejnej... "Ta A12 také může běžet na 4GHz, samozřejmě ne v telefonu." Toto tvrdíte na základě čeho? https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse#comment-1267357 +

6xALU Apple A13 | 26. 8. 2019 - 12:40

Mě udivuje ta ustavičná snaha dělat ze všech debila a chytat se za každé slovíčko.

1) Na jednu stranu se snažíš ze mne udělat lopatu tím, že poukážeš na to, že K6 a Bulldozer jsou vyrobeny na růzvých procesech (kdo by to byl řekl že)... a pak se sám killneš tím, že zmíníš K7 na 180nm, který dosáhl 3x vyšší frekvence jen díky jinému návrhu pipeline. A ještě navíc přinesl širší jádro se 3ALU, což ještě víc podporuje analogii s tím Vortexem. K6 (2ALU) -> K7 (3ALU) je stejných 50% nárůst jako Zen (4ALU) -> Vortex (6ALU).

2) A tu blbost s tou 2x větší frekvencí může napsat fakt jenom lopata. Každý výrobní proces má nějakou max frekvenci přepínání tranzistorů... jak říkáte ten frekvecy wall. A jak budeme tedy zvyšovat dál výkon? Jan Olšan doporučuje AMD Zen3 navrhnout na 8GHz ikdyž jich nikdy ani nedosáhne. Už chápeš co píšeš za blbosti? Každému je jasné že pokud jsme s frekvencema na maximu, tak výkon se může zvyšovat jen pomocí rozšiřování jader, ať už pomocí rozšíření SIMD (jednodušší) nebo zvětšení IPC (o dost složitější). A přesně tím směrem míří ten 6ALU Vortex.

3) Ta A12 může běžět na 4GHz. Ty jako redaktor nevíš že každý CPU má křivku Frekvence vs. napětí? Ty nevíš že to souvisí s tou pipeline a vývážeností jednotlivých stage, že napětí určuje ta nejžravější stage (s její critical path)? Existuje graf pro tu A76, která dokáže běžět na 4GHz při 1.3V. Pokud A76 @2.5GHz potřebuje 0.7V, což je podobné jako ten Vortex, tak se z toho dá jednoduše vyvodit podobné vlastnosti i na těch 4GHz. Je to dáno charakteristikou samotných tranzistorů.

4) Usporný CPU s vysokým IPC může dosáhnout i vyšších frekvencí než vysokofrekvenční CPU, kvůli menšímu přehřívání, které je čím dál horší s každým novým procesem (hustota ztrátového tepla/mm2 roste). Bulldozer s 2ALU prakticky nemohl dosáhnout vyšších frekvencí kvůli příšerné spotřebě a vysokým teplotám. A tedy dosahoval stejných frekvencí jako 3ALU Sandybridge a ten jej drtit s téměř 2x větším IPC. IMHO ten ARM Vortex právě kvůli své úspornosti by mohl mít v desktopu vyšší max frekvence než Zen2 na stejném 7nm procesu.

Mě udivuje ta ustavičná snaha

6xALU Apple A13 https://diit.cz/profil/richard-broda

26. 8. 2019 - 12:40 https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse Mě udivuje ta ustavičná snaha dělat ze všech debila a chytat se za každé slovíčko. 1) Na jednu stranu se snažíš ze mne udělat lopatu tím, že poukážeš na to, že K6 a Bulldozer jsou vyrobeny na růzvých procesech (kdo by to byl řekl že)... a pak se sám killneš tím, že zmíníš K7 na 180nm, který dosáhl 3x vyšší frekvence jen díky jinému návrhu pipeline. A ještě navíc přinesl širší jádro se 3ALU, což ještě víc podporuje analogii s tím Vortexem. K6 (2ALU) -> K7 (3ALU) je stejných 50% nárůst jako Zen (4ALU) -> Vortex (6ALU). 2) A tu blbost s tou 2x větší frekvencí může napsat fakt jenom lopata. Každý výrobní proces má nějakou max frekvenci přepínání tranzistorů... jak říkáte ten frekvecy wall. A jak budeme tedy zvyšovat dál výkon? Jan Olšan doporučuje AMD Zen3 navrhnout na 8GHz ikdyž jich nikdy ani nedosáhne. Už chápeš co píšeš za blbosti? Každému je jasné že pokud jsme s frekvencema na maximu, tak výkon se může zvyšovat jen pomocí rozšiřování jader, ať už pomocí rozšíření SIMD (jednodušší) nebo zvětšení IPC (o dost složitější). A přesně tím směrem míří ten 6ALU Vortex. 3) Ta A12 může běžět na 4GHz. Ty jako redaktor nevíš že každý CPU má křivku Frekvence vs. napětí? Ty nevíš že to souvisí s tou pipeline a vývážeností jednotlivých stage, že napětí určuje ta nejžravější stage (s její critical path)? Existuje graf pro tu A76, která dokáže běžět na 4GHz při 1.3V. Pokud A76 @2.5GHz potřebuje 0.7V, což je podobné jako ten Vortex, tak se z toho dá jednoduše vyvodit podobné vlastnosti i na těch 4GHz. Je to dáno charakteristikou samotných tranzistorů. 4) Usporný CPU s vysokým IPC může dosáhnout i vyšších frekvencí než vysokofrekvenční CPU, kvůli menšímu přehřívání, které je čím dál horší s každým novým procesem (hustota ztrátového tepla/mm2 roste). Bulldozer s 2ALU prakticky nemohl dosáhnout vyšších frekvencí kvůli příšerné spotřebě a vysokým teplotám. A tedy dosahoval stejných frekvencí jako 3ALU Sandybridge a ten jej drtit s téměř 2x větším IPC. IMHO ten ARM Vortex právě kvůli své úspornosti by mohl mít v desktopu vyšší max frekvence než Zen2 na stejném 7nm procesu. https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse#comment-1267399 +

Puf a Muf | 26. 8. 2019 - 23:39

1) Doplňuju významnej detail, tkerý vám jaksi nestál za zmínku. S Lopatama jste si začal, tak se teď nečertěte.

2) "Jan Olšan doporučuje AMD Zen3 navrhnout na 8GHz" --- jsem nikde neřekl. Tady nemáte žádnej Zen na 8 GHz. Tady máte Skylake na 4,5-5,0 GHz a Apple na 2,4 (nebo kolik) GHz, ne výš. Takže to, že nižší IPC, ale vyšší frekvence se vyrovná/předežene vysoké IPC, ale nižší frekvenci, tady platí. Já prostě mluvil o tom, co tu teď máme.

3) "Ta A12 může běžet na 4GHz." --- Až mi to na těch 4 GHz někdo ukáže, tak OK. Já se ptal na doklad, vy jste ho nedal. To vaše tvrzení je těžká teorie a vzhledem k tomu, co jinde píšete, nebudu z fleku věřit tomu, že jste to s tou křivkou interpretoval správně a že to bude přesně podle vašich predikcí. Podobně jako v té debatě, co jsme měli na fóru PC Tuningu, prostě strašně moc předpokládáte a málo se držíte při zemi/ověřené reality.
Člověka, kterej věděl dva roky předem všechno o procesoru (tehdy Zen) na základě toho, co GloFo publikovalo o svojem 14nm procesu, už jsem jednou zažil. Ta sebejistota, s jakou přěsně věděl, jak to CPU dopadne, to bylo dost maso. (Abwx na fóru AnandTech/SemiAccurate.)

4) "Usporný CPU s vysokým IPC může dosáhnout i vyšších frekvencí než vysokofrekvenční CPU, kvůli menšímu přehřívání" --- tak teoreticky asi jo, ale btw znáte takovej příklad z praxe? Jinak je mi to celkem fuk, protože mě tahle debata po pravdě teda moc nebaví, takže tohle klidně nemusíte dál rozebírat.
"A tedy dosahoval stejných frekvencí jako 3ALU Sandybridge" --- takty Bulldozeru byly vyšší, Piledriveru (Bulldozer byl v první revizi dost nedotažený) o dost. Kromě toho, 32nm proces Intelu byl pravděpodobně lepší.
Jinka když jsme u toho, kvůli tomu nízkému IPC si spousta lidí myslí, že ten design byl hodně silně stavěný na vysoké frekvence, že byl jako Pentium 4. To ale není pravda, pipelinou zdaleka tolik nevyčnívá z mainstreamu. Ona je vlastně skoro stejně hluboká, jako toho Sandy Bridge* (aha!). Měl opravdu nízké IPC, ale dané to bylo jinýma věcma, než počtem stupňů pipeline.

* Úplně za to neručím, ale myslím, že Bulldozer/Piledriver byl 20 (takže jako Northwood ale daleko od 30+ Prescottu) a Sandy Bridge 14-19 (celá pipeline má 19 stupňů, ale když je uop-cache hit, tak se některé stupně přeskočí, takže pak je branch misprediction penalty jenom 14).

1) Doplňuju významnej detail,

Puf a Muf https://diit.cz/profil/jan-olsan

26. 8. 2019 - 23:39 https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse 1) Doplňuju významnej detail, tkerý vám jaksi nestál za zmínku. S Lopatama jste si začal, tak se teď nečertěte. 2) "Jan Olšan doporučuje AMD Zen3 navrhnout na 8GHz" --- jsem nikde neřekl. Tady nemáte žádnej Zen na 8 GHz. Tady máte Skylake na 4,5-5,0 GHz a Apple na 2,4 (nebo kolik) GHz, ne výš. Takže to, že nižší IPC, ale vyšší frekvence se vyrovná/předežene vysoké IPC, ale nižší frekvenci, tady platí. Já prostě mluvil o tom, co tu teď máme. 3) "Ta A12 může běžet na 4GHz." --- Až mi to na těch 4 GHz někdo ukáže, tak OK. Já se ptal na doklad, vy jste ho nedal. To vaše tvrzení je těžká teorie a vzhledem k tomu, co jinde píšete, nebudu z fleku věřit tomu, že jste to s tou křivkou interpretoval správně a že to bude přesně podle vašich predikcí. Podobně jako v té debatě, co jsme měli na fóru PC Tuningu, prostě strašně moc předpokládáte a málo se držíte při zemi/ověřené reality. Člověka, kterej věděl dva roky předem všechno o procesoru (tehdy Zen) na základě toho, co GloFo publikovalo o svojem 14nm procesu, už jsem jednou zažil. Ta sebejistota, s jakou přěsně věděl, jak to CPU dopadne, to bylo dost maso. (Abwx na fóru AnandTech/SemiAccurate.) 4) "Usporný CPU s vysokým IPC může dosáhnout i vyšších frekvencí než vysokofrekvenční CPU, kvůli menšímu přehřívání" --- tak teoreticky asi jo, ale btw znáte takovej příklad z praxe? Jinak je mi to celkem fuk, protože mě tahle debata po pravdě teda moc nebaví, takže tohle klidně nemusíte dál rozebírat. "A tedy dosahoval stejných frekvencí jako 3ALU Sandybridge" --- takty Bulldozeru byly vyšší, Piledriveru (Bulldozer byl v první revizi dost nedotažený) o dost. Kromě toho, 32nm proces Intelu byl pravděpodobně lepší. Jinka když jsme u toho, kvůli tomu nízkému IPC si spousta lidí myslí, že ten design byl hodně silně stavěný na vysoké frekvence, že byl jako Pentium 4. To ale není pravda, pipelinou zdaleka tolik nevyčnívá z mainstreamu. Ona je vlastně skoro stejně hluboká, jako toho Sandy Bridge* (aha!). Měl opravdu nízké IPC, ale dané to bylo jinýma věcma, než počtem stupňů pipeline. * Úplně za to neručím, ale myslím, že Bulldozer/Piledriver byl 20 (takže jako Northwood ale daleko od 30+ Prescottu) a Sandy Bridge 14-19 (celá pipeline má 19 stupňů, ale když je uop-cache hit, tak se některé stupně přeskočí, takže pak je branch misprediction penalty jenom 14). https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse#comment-1267461 +

6xALU Apple A13 | 27. 8. 2019 - 18:51

ad 3) Tak jsem to našel, jedná se o A72, v telefonu běží na 2,8GHz na 0.775V ale dokáže běžet v HPC i na 4,2GHz při 1.375V. A pokud jsou jednotlivé stage vyvážené podobně byť se jedná o jiný CPU, tak výsledné škálování bude cca stejné u obou. Jednotlivé délky critical path všech stage v pipeline jsou cca stejné = stejný počet tranzistorů a délka drah, podobné kapacity a indukčnosti. Logicky musí škálovat podobně pokud tam není jiná krpa něco jako lokální přehřívání a kvůli tomu by to throtlovalo. Jiná věc bude o pár procent nižší výkon protože pro vyšší frekvence je třeba mít větší cache. Ale přidat cache je easy. Tedy A12 prostě vpohodě poběží na 4GHz a bude mít výkon jako Skylake na 7GHz - pokud tomu vyladí paměťový subsystém. Kluci to byste mohli jako redaktoři vědět když píšete o CPU. Já jsem se to dozvěděl na fóru Anandtechu což si může přečíst každý laik.

ad 2) Výkon je stejný jen pokud se srovná CPU A12 co běží v telefonu na 2.5GHz se spotřebou 4W, s Intel Skylake na 4GHz se spotřebou cca 20W. Výkon je stejný, v tom máte pane Olšan pravdu. Už ale leckomu přijde divné že nízkotaktovaný CPU v telefonu má stejný výkon jako desktop CPU intel na daleko vyšší frekveci. A to je ta pointa. Pokud na 7nm všichni výrobci CPU narazí na stejný frekquency wall, který je někde na 4.5GHz, pak Apple pokud nataktuje A12 také na 4.5 GHz pak bude drtit všechny x86 CPU rodílem třídy, něco jako Sandy drtil Bulldozer.

Délku pipeline nebudu pitvat, byť částečně máte pravdu a mám radost že tomu někdo rozumí. Ale to není podstata problému a taky samotný počet stage nic neříká kolik tranzistorů obsahuje, což je dost podstatné. Dva CPU se stejným počtem 20 stage a jeden poběží dvakrát pomaleji protože má dvakrát delší tranzistorový řetězec kritické cesty. V reálu to budou jen desítky procent, podle toho jak chytří inženýři na tom makali. Dobrý přiklad byl jednoduchý perceptronový prediktor z Bobcatu, který byl mnohem jednodušší, úspornější a nakonec i přesnější než žravý prediktor u Bulldozeru. Taky našel uplatnění i v Zenu...

https://fuse.wikichip.org/news/2446/tsmc-demonstrates-a-7nm-arm-based-ch...

At a voltage of 1.20, the Cortex cores can reach 4 GHz (signoff). Numbers are based on the cores running Dhrystone pattern workload.
Cortex-A72
Frequency 2.8 GHz 3.0 GHz 3.5 GHz 4.0 GHz 4.2 GHz
Voltage 0.775 V 0.825 V 0.95 V 1.20 V 1.375 V

ad 3) Tak jsem to našel,

6xALU Apple A13 https://diit.cz/profil/richard-broda

27. 8. 2019 - 18:51 https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse ad 3) Tak jsem to našel, jedná se o A72, v telefonu běží na 2,8GHz na 0.775V ale dokáže běžet v HPC i na 4,2GHz při 1.375V. A pokud jsou jednotlivé stage vyvážené podobně byť se jedná o jiný CPU, tak výsledné škálování bude cca stejné u obou. Jednotlivé délky critical path všech stage v pipeline jsou cca stejné = stejný počet tranzistorů a délka drah, podobné kapacity a indukčnosti. Logicky musí škálovat podobně pokud tam není jiná krpa něco jako lokální přehřívání a kvůli tomu by to throtlovalo. Jiná věc bude o pár procent nižší výkon protože pro vyšší frekvence je třeba mít větší cache. Ale přidat cache je easy. Tedy A12 prostě vpohodě poběží na 4GHz a bude mít výkon jako Skylake na 7GHz - pokud tomu vyladí paměťový subsystém. Kluci to byste mohli jako redaktoři vědět když píšete o CPU. Já jsem se to dozvěděl na fóru Anandtechu což si může přečíst každý laik. ad 2) Výkon je stejný jen pokud se srovná CPU A12 co běží v telefonu na 2.5GHz se spotřebou 4W, s Intel Skylake na 4GHz se spotřebou cca 20W. Výkon je stejný, v tom máte pane Olšan pravdu. Už ale leckomu přijde divné že nízkotaktovaný CPU v telefonu má stejný výkon jako desktop CPU intel na daleko vyšší frekveci. A to je ta pointa. Pokud na 7nm všichni výrobci CPU narazí na stejný frekquency wall, který je někde na 4.5GHz, pak Apple pokud nataktuje A12 také na 4.5 GHz pak bude drtit všechny x86 CPU rodílem třídy, něco jako Sandy drtil Bulldozer. Délku pipeline nebudu pitvat, byť částečně máte pravdu a mám radost že tomu někdo rozumí. Ale to není podstata problému a taky samotný počet stage nic neříká kolik tranzistorů obsahuje, což je dost podstatné. Dva CPU se stejným počtem 20 stage a jeden poběží dvakrát pomaleji protože má dvakrát delší tranzistorový řetězec kritické cesty. V reálu to budou jen desítky procent, podle toho jak chytří inženýři na tom makali. Dobrý přiklad byl jednoduchý perceptronový prediktor z Bobcatu, který byl mnohem jednodušší, úspornější a nakonec i přesnější než žravý prediktor u Bulldozeru. Taky našel uplatnění i v Zenu... https://fuse.wikichip.org/news/2446/tsmc-demonstrates-a-7nm-arm-based-chiplet-design-for-hpc/ At a voltage of 1.20, the Cortex cores can reach 4 GHz (signoff). Numbers are based on the cores running Dhrystone pattern workload. Cortex-A72 Frequency 2.8 GHz 3.0 GHz 3.5 GHz 4.0 GHz 4.2 GHz Voltage 0.775 V 0.825 V 0.95 V 1.20 V 1.375 V https://diit.cz/clanek/openpower-summit-otevrena-isa-novy-stroj-od-raptoru/diskuse#comment-1267535 +

Puf a Muf | 27. 8. 2019 - 19:21

"Výkon je stejný jen pokud se srovná CPU A12 co běží v telefonu na 2.5GHz se spotřebou 4W, s Intel Skylake na 4GHz se spotřebou cca 20W. Výkon je stejný, v tom máte pane Olšan pravdu. Už ale leckomu přijde divné že nízkotaktovaný CPU v telefonu má stejný výkon jako desktop CPU intel na daleko vyšší frekveci."

On ten Skylake pořád dosáhne frekvencí ještě výš než 4,0 GHz (a btw, spotřeba 1 jádra při 4,0 GHz je iirc výrazně nižší než 20 W) a ten A12 v jednovláknovém výkonu IIRC dohání spíš jenom ty pomalejší verze. Ale jak jsem říkal výš, zase třeba to jádro A12 může stát o dost víc tranzistorů... na ty jádra jsou kladené různé požadavky, proto se nedá tak jednoduše uzavřít, že A12 má mnohem větší IPC, tudíž Intel je blbej a neschopnej.
A12 neumí SMT, neumí 256bit SIMD, asi by se daly najít i další věci...

6xALU Apple A13 | 27. 8. 2019 - 23:39

A proto je ČR tam kde je...

Když redaktoři co píšou o CPU naprosto bagatelizují zcela zásadní věci. Vysoké IPC a množství ALU byl, je a bude svatý grál konstrukce CPU. Takové pitomosti jako zdvojnásobení SIMD přinesl Zen2 po dvou letech. A co jako? Intel má dávno 512bit.

A ano, Intel je blbej a neschopnej když neumí 6xALU CPU. Apple to umí a je v současné době lídrem na poli CPU architektury. Toto je v podstatě závěr odborníků z Anandtechu, ale čeští redaktoři, kteří ještě včera nevěděli jak je možné že frekvence Cortexu škáluje s voltáží až na 4GHz, s tím samozřejmě budou nesouhlasit.

Takhle nějak si předtavuju redaktory za komančů, imperialisti ze západu z Anandtechu jsou blbci, my v ČR jsme nejchytřejší přestože sotva dokážeme vyrobit celé vodiče. Kdo se chce vyhnout bludům musí i dnes chodit pro informace do zahraničí. Zase tak moc se nezměnilo. Železná opona hlouposti je tu pořád. A budu se čertit dokud se v ČR nebudou vyvíjet CPU. Když to dokáže pitomej Izrael (Intel lab) s polovinou obyvatel z nichž část jezdí do supermarketu na oslech, což jsem viděl na vlastní oči, tak nevím proč by to nedokázala ČR. Po válce profesor Svoboda soutěžil s IBM o nejvýkonější počítače na světě, tuším že v ČSSR byl postaven první 32-bit releový CPU s redundatní autoopravnou ALU na světě. Kdepak jsme dnes?

Puf a Muf | 25. 8. 2019 - 19:38

"Exynos 9810 je dvakrát horší jak jsem psal."
Jo ještě, já jsem prve dumal, proč tam pletete ten Exynos... víte doufám, že v Exynosu má Samsung vlastní jádro, a ne Cortex-A76? Jestli vám to ušlo, tak to by vysvětlovalo ten omyl s 2x efektivitou :)
Cortex-A76 je v tom Kirinu 980 nebo Snapdragonu 855.

EETagent | 24. 8. 2019 - 07:40

A přesto prohrávají iPhony v testech s telefony s mnohem slabším SD 855, které v dlouhodobé zátěži throttlují mnohem méně. Samozřejmě rychlé úložiště a více RAM v Androidech na to má také vliv.

A dávno by A12,A11,A10 byla v Apple noteboocích ne? Alespoň v Airech? Čím to bude? Třeba, že iGPU stojí za nic, a výkon po započtení x86 emulace je určitě oproti x86 nezajímavý.

Mirda Červíček | 24. 8. 2019 - 08:14

Přidávání jednotek-zvětšování šířky je ta nejjednodušší cesta.....no zjednodušeně - když by to byla správná cesta, tak to dělají i AMD s Intelem a mají třeba 10 ALU jednotek i za cenu menšího počtu jader.

Milan Bačík | 24. 8. 2019 - 10:54

Aby to mělo jakoukoliv šanci na úspěch tak mi se musel úplně změnit SW. Ten se ale ve skutečnosti mění přesně opačným směrem, k dynamickým kompilátorúm, které generují horší kód a dokážou využít ještě míň paralelních jednotek. Kód, u kterého se to vyplatí, se pak převádí na SIMD a běží přes SIMD jednotky nebo rovnou na GPU.

Gath G | 25. 8. 2019 - 10:32

Nevidím důvod, proč by dynamické kompilátory *musely* být horší. To je čistě otázka lenosti implementátorů. Na jednu stranu je sice pravda, že pokročilejší generování kódu zabere o něco více času. Na druhou stranu ale zase vždycky máte možnost uplatnit ho na místech, kde se nejlépe projeví, a případně kód zlepšovat "postupně". Protože většinou vede ke slušnému bobtnání kódu, zvláště na malých strojích (ať už jde o cache, nebo o celou operační paměť) nemusí být optimální naprat ho naslepo úplně všude v softwaru.

franzzz | 24. 8. 2019 - 12:30

> Teoreticky by A12 díky 6xALU měla mít o 50% větší IPC,

Ne nemela mit. O 50% vyssi by bylo ** maximalni ** dosazitelne IPC.

IPC totiz nezavisi jenom na poctu ALU, IPC zavisi taky na programu. K tomu abys vyuzil 6x ALU potrebujes program, ktery ma v kazdem okamziku 6 nezavislych instrukci. Nebo hyperthreading a vic programu najednou.

A co se tyce Anandtechu: "The performance measurement was run in a synthetic environment (read: bench fan cooling the phones)"-- plus ty testy jsou single-thread. Takze ta architektura je fajn, ale to neznamena ze kdyby Apple udelal velkou verzi, najednou by mel 2x rychlejsi desktopovy procak nez Intel/AMD.

super master | 25. 8. 2019 - 10:25

jak souvisi aplikacni sw s vykonem cpu?

Milan Bačík | 24. 8. 2019 - 10:48

AMD už dnes v procesoru jedno malé RISC jádro má. Intel ho má v PCH.

Puf a Muf | 24. 8. 2019 - 11:16

Jenže to má funkci řídící jednotky, není viditelné pro uživatele. Přesně do těchhle rolí se bude dostávat RISC-V, ale v případě AMD asi ne, protože to využívá zároveň technologii Trustzone od ARMu, takže má důvody zůstat.
Intel měl v PCH pro účely IME jádra ARC (ty asi RISC-V hodně bude nahrazovat), ale od Skylake právě že přešel na vlastní x86 (něco jako quarky), asi aby ušetřil.

Můžou tam ale samozřejmě být uvnitř i další embedded MCU pro různé další funkce, které mají jinou ISA.

Libor Bauer | 25. 8. 2019 - 16:03

No joo, jenze uz AMD K5 byla defakto interne RISC procesorem ;-))

Puf a Muf | 24. 8. 2019 - 11:26

Dovolil bych si tipnout, že mnohem spíš než x86 zanikne Power. Ono totiž tohle může být případ open sourcování, když firmě nic jiného nezbývá. Ne že by IBM úplně selhávalo s vlastníma Power CPU, ale mají moc malý záběr na trhu, tudíž malý ekosystém, tudíž malou softwarovou podporu. A malé platformy mají hroznou nevýhodu proti větším. Takže IBM jednak asi má vítr z toho, že by se jako hlavní alternativní archtiektura v serverech prosadil ARM, jednak taky AMD s Epycem teď udělalo dost silnou alternativu ke Xeonům, takže se vůbec zmenšila motivace jít to alternativní architektury.

Otevření SPARCu tak nějak bylo tohoto charakteru, a díru do světa pak už neudělal. IMHO tohle nebude nějaký game changer ani pro Power, RISC-V už je rozběhnutý, takže v rolích, kde je ten, má už Power asi smůlu, RISC-V má mnohem víc jader hotových k použití, a už nabral setrvačnost. V ostatních oblastech se to asi zase neprosadí proti ARMu i když ARM je za peníze. A je podle mě hodně nepravděpodobný, že někdo mimo IBM teď vezme tu instrukční sadu a navrhne něco jako Power8/9, tj. alternativní výkonné jádro, který by mohlo rozšířit ten ekosystém v desktopu/serverech.

Jabba | 24. 8. 2019 - 19:38

Budoucnost patří aluminiu!

Gath G | 25. 8. 2019 - 10:35

Doufám že zbyde něco i pro fpuminium, jinak numerici zapláčou.

Mirda Červíček | 24. 8. 2019 - 08:09

Když po tomhle neskočí Čína, tak to má někde skrytý problém. Jinak si to neumím vysvětlit.

danieel | 24. 8. 2019 - 09:19

Pokud si dobre pamatuji, tak cinske HPC stavi na MIPS jadrech.
https://en.wikipedia.org/wiki/Loongson

Puf a Muf | 24. 8. 2019 - 11:17

To není moc HPC. Ale v jednom z těch superpočítačů například měli vlastní procesor ARM ("Mars"). GPGPU-like akcelerátory můžou mít už úplně různou ISA.

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.

Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k OpenPOWER summit: otevřená ISA a nový stroj od Raptoru

Komerční sdělení

CDR Hry

Epic rozdává zdarma dvě hry, které potěší hráče RPG her a adventur

Copilot mizí z Edge jen na oko. Ve skutečnosti je teď úplně všude

Existují mimozemšťané? Tohle dnes říká věda, armády i astronomové

„Budu v pohodě?“ ptal se ChatGPT. Krátce poté zemřel

Falešný TikTok znovu útočí. Nový malware krade bankovní účty i kryptoměny

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT