A dnes AMD pre (pravdepodobne) Zen3 a pokračovateľov zväčšili limit na mikrokód na TROJnásobok (prečo tak divný násobok z pohľadu dvojkovej sústavy. Nárast z 2^12 B na 1,5 x 2^13 B je divné. Prečo nie 2^14?
The Linux Kernel Prepares For Larger AMD CPU Microcode Updates
Written by Michael Larabel in AMD on 15 April 2020 at 06:48 AM EDT.
Future AMD CPUs (more than likely, Zen 3) will be bearing larger CPU microcode sizes, resulting in the Linux kernel needing a change to load them.
Currently the AMD Linux CPU microcode handler has a static upper limit of the page size, which is generally 4K.
With a change now pending as part of the x86/urgent work, that upper limit is being bumped to a factor of three times the page size. In other words, up to 12K microcode update size.
15. 4. 2020 - 18:38https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseAle ja som sa trafil keď mi kolrga odpovedal
>danieel | před 21 hodinami
>Ja pochybuji ze existuje ruzny microcode pro
>ruzne OS.
https://diit.cz/clanek/ryzen-7-3700c-ryzen-3-3250c-pro-chromebooky/diskuse
A dnes AMD pre (pravdepodobne) Zen3 a pokračovateľov zväčšili limit na mikrokód na TROJnásobok (prečo tak divný násobok z pohľadu dvojkovej sústavy. Nárast z 2^12 B na 1,5 x 2^13 B je divné. Prečo nie 2^14?
The Linux Kernel Prepares For Larger AMD CPU Microcode Updates
Written by Michael Larabel in AMD on 15 April 2020 at 06:48 AM EDT.
Future AMD CPUs (more than likely, Zen 3) will be bearing larger CPU microcode sizes, resulting in the Linux kernel needing a change to load them.
Currently the AMD Linux CPU microcode handler has a static upper limit of the page size, which is generally 4K.
With a change now pending as part of the x86/urgent work, that upper limit is being bumped to a factor of three times the page size. In other words, up to 12K microcode update size.
https://www.phoronix.com/scan.php?page=news_item&px=AMD-Larger-Microcode-Linuxhttps://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292207
+
15. 4. 2020 - 15:16https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseSpíš do modrého, řekl bych.
[Pardon, to mělo být pod komentář výše.]https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292188
+
pri ty kapacite l3 na jadro to imo budou x86 procaky s vubec nejlepsim ipc..
+1
+3
-1
Je komentář přínosný?
pri ty kapacite l3 na jadro
Tom Buri https://diit.cz/profil/t-b
15. 4. 2020 - 15:52https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskusepri ty kapacite l3 na jadro to imo budou x86 procaky s vubec nejlepsim ipc..https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292192
+
Ne, nemají 6x ALU a frekvence se ani trochu neblíží 5GHz.
+1
+15
-1
Je komentář přínosný?
Ne, nemají 6x ALU a frekvence
Karáš Svorka https://diit.cz/autor/zaatharen
15. 4. 2020 - 16:32https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseNe, nemají 6x ALU a frekvence se ani trochu neblíží 5GHz.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292198
+
Jó kde jsou ty časy, když si vzpomenu na p4 a řeči intelu o 10ghz před xx lety...
+1
+5
-1
Je komentář přínosný?
Jó kde jsou ty časy, když si
DRK https://diit.cz/profil/drk22
15. 4. 2020 - 16:51https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseJó kde jsou ty časy, když si vzpomenu na p4 a řeči intelu o 10ghz před xx lety...https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292200
+
Tomu Epycu ta obří L3 cache pomohla v jednotkách procent. Vždyť si ten 2P EPYC F namazal na chleba i ThreadRipper se steným počtem jader. To je pro ty mamlasy co si myslí že IPC se zvyšuje zvětšováním L3 cache. Chtěli byste aby nové GPU od AMD měli 2x větší cache a počet CU zůstal stejný? To by bylo kvikotu, že to nemá výkon. Výkon dělají výpočetní jednotky a cache je pomáhá jenom krmit, nic víc.
Hoši, dokud bude mít AMD ubohé 4xALU tak z toho žádný pořádný výkon nedostanou a pořád budou ztrácet 80% IPC na Apple. Už i ten pitomej Cortex A77 v čínských telefonech je širší než Zen2.
A77 - 4xALU+2xBranch …….. 2xLSU+2xStore ……. 2xFPU
Zen2-4xALU...………………….2xLSU+1xStore...…...4xFPU
Nebýt 2x větší FPU tak Zen2 prohrává úplně ve všem. A příští rok budou mít nové ARMy místo 128 bit NEONu 2048-bit SVE2. To chci vidět s čím přijde AMD a Intel. Po 7-mi letech co je AVX512 venku je jeho rozšíření prakticky nulové. Game over x86.
+1
-3
-1
Je komentář přínosný?
Tomu Epycu ta obří L3 cache
6xALU Apple A13 https://diit.cz/profil/richard-broda
16. 4. 2020 - 15:11https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseTomu Epycu ta obří L3 cache pomohla v jednotkách procent. Vždyť si ten 2P EPYC F namazal na chleba i ThreadRipper se steným počtem jader. To je pro ty mamlasy co si myslí že IPC se zvyšuje zvětšováním L3 cache. Chtěli byste aby nové GPU od AMD měli 2x větší cache a počet CU zůstal stejný? To by bylo kvikotu, že to nemá výkon. Výkon dělají výpočetní jednotky a cache je pomáhá jenom krmit, nic víc.
Hoši, dokud bude mít AMD ubohé 4xALU tak z toho žádný pořádný výkon nedostanou a pořád budou ztrácet 80% IPC na Apple. Už i ten pitomej Cortex A77 v čínských telefonech je širší než Zen2.
A77 - 4xALU+2xBranch …….. 2xLSU+2xStore ……. 2xFPU
Zen2-4xALU...………………….2xLSU+1xStore...…...4xFPU
Nebýt 2x větší FPU tak Zen2 prohrává úplně ve všem. A příští rok budou mít nové ARMy místo 128 bit NEONu 2048-bit SVE2. To chci vidět s čím přijde AMD a Intel. Po 7-mi letech co je AVX512 venku je jeho rozšíření prakticky nulové. Game over x86.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292306
+
Až na to že vektorová jednotka ARM procesorů má šířku 128 bit, kdežto AMD ZEN 2 256 bit. Taky nejde přímo porovnávat RISC architektura a x86-64. Přidání nových instrukcí nebo jiných jednotek neznamená automaticky nárůst výkonu. Záleží na programátorech.
+1
+2
-1
Je komentář přínosný?
Až na to že vektorová
Kutil https://diit.cz/profil/andrewx
16. 4. 2020 - 15:47https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseAž na to že vektorová jednotka ARM procesorů má šířku 128 bit, kdežto AMD ZEN 2 256 bit. Taky nejde přímo porovnávat RISC architektura a x86-64. Přidání nových instrukcí nebo jiných jednotek neznamená automaticky nárůst výkonu. Záleží na programátorech.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292308
+
Ano správně. Přestože Apple A13 používá jen 128-bit NEON instrukce, tak má FPU IPC(PPC) vyšší o 65% než Zen2, který má 256-bit. Podobné jako když Zen2 s 256bit AVX2 drtí Intel s jeho 512bit. Akorát že AMD nemá oproti Intelu náskok 65%.
Ty 2048-bit SVE2 jsou důležité kvůli stabilitě vývoje SW. ARM už žádnou větší šířku implementovat nebude, takže SW který ručně optimalizuješ bude prakticky nafurt. Než se Intel s AMD dohrabou na 2048bit tak mezitím vydají 4 verze AVX což bude znamenat pokaždé znovu SW předělávat. Proto AVX512 prakticky nikoho nezajímá.
+1
-2
-1
Je komentář přínosný?
Ano správně. Přestože Apple
6xALU Apple A13 https://diit.cz/profil/richard-broda
16. 4. 2020 - 16:12https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseAno správně. Přestože Apple A13 používá jen 128-bit NEON instrukce, tak má FPU IPC(PPC) vyšší o 65% než Zen2, který má 256-bit. Podobné jako když Zen2 s 256bit AVX2 drtí Intel s jeho 512bit. Akorát že AMD nemá oproti Intelu náskok 65%.
Ty 2048-bit SVE2 jsou důležité kvůli stabilitě vývoje SW. ARM už žádnou větší šířku implementovat nebude, takže SW který ručně optimalizuješ bude prakticky nafurt. Než se Intel s AMD dohrabou na 2048bit tak mezitím vydají 4 verze AVX což bude znamenat pokaždé znovu SW předělávat. Proto AVX512 prakticky nikoho nezajímá.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292313
+
Ty gdybys pracoval ve vietnamské večerce, tak mi prodáš i pičifuk a vložky...
+1
+2
-1
Je komentář přínosný?
Ty gdybys pracoval ve
Hrdina https://diit.cz/profil/david-baranek
16. 4. 2020 - 18:09https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseTy gdybys pracoval ve vietnamské večerce, tak mi prodáš i pičifuk a vložky...https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292329
+
S tím že chutnají o 89% líp jak originál hamburger...
+1
+1
-1
Je komentář přínosný?
S tím že chutnají líp jak
DRK https://diit.cz/profil/drk22
16. 4. 2020 - 19:51https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseS tím že chutnají o 89% líp jak originál hamburger...
https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292336
+
"Přestože Apple A13 používá jen 128-bit NEON instrukce, tak má FPU IPC(PPC) vyšší o 65% než Zen2, který má 256-bit. "
Takže A13 pouze se 128b jednotkami zvládne 40 double-precision FP operací na takt?
+1
0
-1
Je komentář přínosný?
"Přestože Apple A13 používá
Gath G https://diit.cz/profil/ggeal
17. 4. 2020 - 17:55https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse"Přestože Apple A13 používá jen 128-bit NEON instrukce, tak má FPU IPC(PPC) vyšší o 65% než Zen2, který má 256-bit. "
Takže A13 pouze se 128b jednotkami zvládne 40 double-precision FP operací na takt?https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292452
+
Žádný serverový procesor AMD, Intel ani IBM nejde přes 4 GHz. U těchto procesorů je důležitá efektivita. ZEN 2 má vyšší IPC než stávající i "nově uvedené" Intel, protože ty mají už několik generací stejné jádro, pro Intel je přidání plochy křemíku daleko dražší. IPC není daná jen počtem výpočetních jednotek a taktem, je to daleko složitější. U desktopových 8. a 10. jader Intelu je TDP udáváno jen pro základní takt, běžná spotřeba je větší a v maximu podle kvality chlazení až 3,35x větší a to bez přetaktování. Podobné to je i u modelů pro notebooky. Intel měl být už dávno jinde a ne na 14+++ nm.
+1
+2
-1
Je komentář přínosný?
Žádný serverový procesor AMD,
Kutil https://diit.cz/profil/andrewx
15. 4. 2020 - 18:13https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseŽádný serverový procesor AMD, Intel ani IBM nejde přes 4 GHz. U těchto procesorů je důležitá efektivita. ZEN 2 má vyšší IPC než stávající i "nově uvedené" Intel, protože ty mají už několik generací stejné jádro, pro Intel je přidání plochy křemíku daleko dražší. IPC není daná jen počtem výpočetních jednotek a taktem, je to daleko složitější. U desktopových 8. a 10. jader Intelu je TDP udáváno jen pro základní takt, běžná spotřeba je větší a v maximu podle kvality chlazení až 3,35x větší a to bez přetaktování. Podobné to je i u modelů pro notebooky. Intel měl být už dávno jinde a ne na 14+++ nm.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292205
+
Mně by zajímalo, jestli ten boost u serverových CPU (Xeon, Epyc) je garantován pro všechny jádra a záleží jen na tom, zda se to uchladí. Nebo se ten boost projeví jen u "výběrových" jader.
+1
0
-1
Je komentář přínosný?
Mně by zajímalo, jestli ten
PKoz https://diit.cz/profil/petr-kozeluh
17. 4. 2020 - 13:28https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseMně by zajímalo, jestli ten boost u serverových CPU (Xeon, Epyc) je garantován pro všechny jádra a záleží jen na tom, zda se to uchladí. Nebo se ten boost projeví jen u "výběrových" jader.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292425
+
Pretoze so 6x ALU nebudu stracat cas a sustredia sa rovno na 8x ALU :)
+1
+1
-1
Je komentář přínosný?
Pretoze so 6x ALU nebudu
spidsta https://diit.cz/profil/jan-tomko
15. 4. 2020 - 18:41https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskusePretoze so 6x ALU nebudu stracat cas a sustredia sa rovno na 8x ALU :)https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292208
+
Nejde jen o počet jednotek, je třeba taky uzpůsobit dekodéry instrukcí, předpovědi skoků a zajistit datovou propustnost, jinak se ty jednotky navíc budou víc flákat než pracovat.
+1
+1
-1
Je komentář přínosný?
Nejde jen o počet jednotek,
Kutil https://diit.cz/profil/andrewx
15. 4. 2020 - 19:17https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseNejde jen o počet jednotek, je třeba taky uzpůsobit dekodéry instrukcí, předpovědi skoků a zajistit datovou propustnost, jinak se ty jednotky navíc budou víc flákat než pracovat.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292212
+
nenenenene.. dekodery a prediktory sou k nicemu, jen zabiraj misto, kde by mohly byt dalsi alu.. vic alu, vic adidas..
+1
+5
-1
Je komentář přínosný?
nenenenene.. dekodery a
Tom Buri https://diit.cz/profil/t-b
15. 4. 2020 - 19:33https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskusenenenenene.. dekodery a prediktory sou k nicemu, jen zabiraj misto, kde by mohly byt dalsi alu.. vic alu, vic adidas..https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292213
+
Presne tak a zaberaju miesto 4096 vektorovym instrukciam
+1
+4
-1
Je komentář přínosný?
Presne tak a zaberaju miesto
spidsta https://diit.cz/profil/jan-tomko
15. 4. 2020 - 19:35https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskusePresne tak a zaberaju miesto 4096 vektorovym instrukciamhttps://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292214
+
To jako místní experti trvdí, že Apple má 6xALU, ale nemá žádný decode a prefetch? Tak to jo, odborníci k pohledání. Samozřejmě že Apple má 6xALU a k tomu neméně brutálně výkonný prefetch a decode. Apple ukazuje že těch 80% IPC tam je a lze toho dosáhnout. Problém je že AMD ani Intel žádnou podobně výkonnou architekturu nejsou schopni vytvořit, protože Intel seděl 5 let na zadku jako monopol a AMD po uvedení Bulldozeru 5 let bojovalo o přežití.
+1
0
-1
Je komentář přínosný?
To jako místní experti trvdí,
6xALU Apple A13 https://diit.cz/profil/richard-broda
16. 4. 2020 - 16:02https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseTo jako místní experti trvdí, že Apple má 6xALU, ale nemá žádný decode a prefetch? Tak to jo, odborníci k pohledání. Samozřejmě že Apple má 6xALU a k tomu neméně brutálně výkonný prefetch a decode. Apple ukazuje že těch 80% IPC tam je a lze toho dosáhnout. Problém je že AMD ani Intel žádnou podobně výkonnou architekturu nejsou schopni vytvořit, protože Intel seděl 5 let na zadku jako monopol a AMD po uvedení Bulldozeru 5 let bojovalo o přežití.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292312
+
Myslím že reálný výkon Apple ARM bude možno reálně srovnat s Intel a AMD procesory teprve až na nich pojede stejný software, tj až budou mít procesor aspoň do NTB. Srovnání různé architektury ještě v různém softwaru může být zavádějící. Krásně se to ukázalo při srovnání pracovních stanic Raptor Talos II na linuxu, kdy v něčem byly procesory IBM Power 9 nedostižné a jinde na chvostu.
+1
+2
-1
Je komentář přínosný?
Myslím že reálný výkon Apple
Kutil https://diit.cz/profil/andrewx
16. 4. 2020 - 20:28https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseMyslím že reálný výkon Apple ARM bude možno reálně srovnat s Intel a AMD procesory teprve až na nich pojede stejný software, tj až budou mít procesor aspoň do NTB. Srovnání různé architektury ještě v různém softwaru může být zavádějící. Krásně se to ukázalo při srovnání pracovních stanic Raptor Talos II na linuxu, kdy v něčem byly procesory IBM Power 9 nedostižné a jinde na chvostu.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292340
+
No co se týče Linuxu a spousty aplikací, tak to není problém ...
+1
0
-1
Je komentář přínosný?
No co se týče Linuxu a
PKoz https://diit.cz/profil/petr-kozeluh
17. 4. 2020 - 13:29https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseNo co se týče Linuxu a spousty aplikací, tak to není problém ...https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292426
+
Jen výkon ARM Apple tam jaksi není vidět, ale možná jsem málo hledal
+1
0
-1
Je komentář přínosný?
Jen výkon ARM Apple tam jaksi
Kutil https://diit.cz/profil/andrewx
17. 4. 2020 - 16:00https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseJen výkon ARM Apple tam jaksi není vidět, ale možná jsem málo hledalhttps://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292440
+
Těžko hledat, co existuje výhradně ve vlhkých Richieho snech ;-)
+1
0
-1
Je komentář přínosný?
Těžko hledat, co existuje
maruširi https://diit.cz/profil/marusiri
20. 4. 2020 - 20:50https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseTěžko hledat, co existuje výhradně ve vlhkých Richieho snech ;-)https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292615
+
Nie, miestni exprerti tvrdia, ze az Apple CPU bude porovnatelne s Intel a AMD vo VSETKYCH typoch HPC zataze (nie len tych par, ktore si si ako modlu vybral a ktorej svedci vyssi pocet ALU), mozme porovnavat jeho efektivitu a architekturu. Pretoze je nutne si uvedomit, ze zvysovanie IPC od urcitej hranice vyzaduje (zjednodusene povedane) exponencialne naklady na zdroje a ARM to len teraz zacne mat tazke v dotahovani sa.
Az Apple procesor bude mat dostatocne velku cache, bude podporovat velky pocet RAM modulov, multi-socket systemy, bude mat naozaj vela jadier, atd atd. mozme zacat porovnavat, za akych podmienok (cene/spotrebe/...) to dokazal. Dovtedy je to len vlhky sen.
Inak keby Apple CPU bol skutocne tak dobry, ako hovoris, uz davno nahradi Intel vo VSETKYCH svojich produktoch a zacne ho tlacit aj do HPC segmentu.
+1
+1
-1
Je komentář přínosný?
Nie, miestny exprerti tvrdia,
spidsta https://diit.cz/profil/jan-tomko
18. 4. 2020 - 08:46https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseNie, miestni exprerti tvrdia, ze az Apple CPU bude porovnatelne s Intel a AMD vo VSETKYCH typoch HPC zataze (nie len tych par, ktore si si ako modlu vybral a ktorej svedci vyssi pocet ALU), mozme porovnavat jeho efektivitu a architekturu. Pretoze je nutne si uvedomit, ze zvysovanie IPC od urcitej hranice vyzaduje (zjednodusene povedane) exponencialne naklady na zdroje a ARM to len teraz zacne mat tazke v dotahovani sa.
Az Apple procesor bude mat dostatocne velku cache, bude podporovat velky pocet RAM modulov, multi-socket systemy, bude mat naozaj vela jadier, atd atd. mozme zacat porovnavat, za akych podmienok (cene/spotrebe/...) to dokazal. Dovtedy je to len vlhky sen.
Inak keby Apple CPU bol skutocne tak dobry, ako hovoris, uz davno nahradi Intel vo VSETKYCH svojich produktoch a zacne ho tlacit aj do HPC segmentu.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292479
+
Multi socket systémy a vyměnitelná RAM zní jako něco z devadesátých let. Na vše stačí iPhone.
+1
+1
-1
Je komentář přínosný?
Multi socket systémy a
Karáš Svorka https://diit.cz/autor/zaatharen
18. 4. 2020 - 13:20https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseMulti socket systémy a vyměnitelná RAM zní jako něco z devadesátých let. Na vše stačí iPhone.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292486
+
vypnuté väčšinu prediktorov znižuje výkon CPU o cca. 93%
Google Engineer Shows "SESES" For Mitigating LVI + Side-Channel Attacks - Code Runs ~7% Original Speed
on 21 March 2020
Čisto iba lfence na intel only chybu LVI výkon -78%..
LFENCE barrier instruction around loads, indirect branches, and RET instructions. The tests on Kabylake found that the mitigated performance overall was about 22% that of the performance without the LVI mitigations.
Google engineer in working to avoid LVI and other side-channel vulnerabilities in one of her tests saw just ~7% the original performance based on the geometric mean.
15. 4. 2020 - 20:04https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseTo by ste to dopracovali..
vypnuté väčšinu prediktorov znižuje výkon CPU o cca. 93%
Google Engineer Shows "SESES" For Mitigating LVI + Side-Channel Attacks - Code Runs ~7% Original Speed
on 21 March 2020
Čisto iba lfence na intel only chybu LVI výkon -78%..
LFENCE barrier instruction around loads, indirect branches, and RET instructions. The tests on Kabylake found that the mitigated performance overall was about 22% that of the performance without the LVI mitigations.
Google engineer in working to avoid LVI and other side-channel vulnerabilities in one of her tests saw just ~7% the original performance based on the geometric mean.
https://www.phoronix.com/scan.php?page=news_item&px=LLVM-SESES-Mitigating-LVI-More
https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292216
+
Ale Tom si dela prcu z mistniho saska Richieho, ktery tlaci mantru 6xALU = singularita je zarohem :D
+1
+4
-1
Je komentář přínosný?
Ale Tom si dela prcu z
Mali https://diit.cz/profil/tomas-malecek1
16. 4. 2020 - 00:50https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseAle Tom si dela prcu z mistniho saska Richieho, ktery tlaci mantru 6xALU = singularita je zarohem :Dhttps://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292222
+
"vypnuté väčšinu prediktorov znižuje výkon CPU o cca. 93%"
Ano, všichni pamatujeme Itanic. :D
+1
0
-1
Je komentář přínosný?
"vypnuté väčšinu prediktorov
Gath G https://diit.cz/profil/ggeal
17. 4. 2020 - 17:56https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse"vypnuté väčšinu prediktorov znižuje výkon CPU o cca. 93%"
Ano, všichni pamatujeme Itanic. :Dhttps://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292453
+
U Itania šlo o naprosto odlišnou architekturu velmi širokého jádra, kde optimalizaci kódu měl na starosti kompilátor. A to byl celý problém. Že na vydávání nových CPU Intel ke konci dlabal, bylo dané tím, že v tom už tak utopil hodně peněz. Ale neúspěšných projektů měli v minulosti víc.
+1
0
-1
Je komentář přínosný?
U Itania šlo o naprosto
Kutil https://diit.cz/profil/andrewx
17. 4. 2020 - 18:06https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseU Itania šlo o naprosto odlišnou architekturu velmi širokého jádra, kde optimalizaci kódu měl na starosti kompilátor. A to byl celý problém. Že na vydávání nových CPU Intel ke konci dlabal, bylo dané tím, že v tom už tak utopil hodně peněz. Ale neúspěšných projektů měli v minulosti víc.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292454
+
Ano, vždyť o tom to je - ukázalo že, spoustu věcí staticky v kompilátoru řešit nelze. Ty obvody navíc tam mají svůj smysl.
+1
+1
-1
Je komentář přínosný?
Ano, vždyť o tom to je -
Gath G https://diit.cz/profil/ggeal
17. 4. 2020 - 18:27https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseAno, vždyť o tom to je - ukázalo že, spoustu věcí staticky v kompilátoru řešit nelze. Ty obvody navíc tam mají svůj smysl.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292457
+
Intel to chtěl zabalit dřív, ale HP si soudně zajistilo, že něco ještě vydají, protože prodali HW nějakým zákazníkům, kteří chtěli v rámci Itanium rodiny upgrade a podporu.
+1
+1
-1
Je komentář přínosný?
Intel to chtěl zabalit dřív,
Karáš Svorka https://diit.cz/autor/zaatharen
17. 4. 2020 - 21:21https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseIntel to chtěl zabalit dřív, ale HP si soudně zajistilo, že něco ještě vydají, protože prodali HW nějakým zákazníkům, kteří chtěli v rámci Itanium rodiny upgrade a podporu.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292465
+
A hele jak se daří ladit 7nm u TSMC.
Že mně výčet těch firem vůbec nepřekvapil. Epycy 7Fx2 jsou jak dělané pro OS v cloudu. Hodně lidí v tom vidí budoucnost IT. AMD nechce zůstat pozadu.
Homeoffice zažívá ohromný boom díky pandemii. Takže přišli na trh v pravý čas.
+1
+1
-1
Je komentář přínosný?
Že mně výčet těch firem vůbec
samuel-007 (neověřeno) https://diit.cz
15. 4. 2020 - 21:24https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseA hele jak se daří ladit 7nm u TSMC.
Že mně výčet těch firem vůbec nepřekvapil. Epycy 7Fx2 jsou jak dělané pro OS v cloudu. Hodně lidí v tom vidí budoucnost IT. AMD nechce zůstat pozadu.
Homeoffice zažívá ohromný boom díky pandemii. Takže přišli na trh v pravý čas. https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292220
+
Protože jsou to fyzicky stejné EPYC Rome, jen mají jinou konfiguraci L3 cache, aktivních čipletů, frekvence a TDP.
+1
+1
-1
Je komentář přínosný?
Protože jsou to fyzicky
Karáš Svorka https://diit.cz/autor/zaatharen
16. 4. 2020 - 00:53https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseProtože jsou to fyzicky stejné EPYC Rome, jen mají jinou konfiguraci L3 cache, aktivních čipletů, frekvence a TDP.https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292223
+
AVX-512 až se ZEN 4 na 5 nm, zabírají moc místa a papají moc energie a v desktopu nejsou k ničemu
+1
0
-1
Je komentář přínosný?
AVX-512 až se ZEN 4 na 5 nm,
Kutil https://diit.cz/profil/andrewx
16. 4. 2020 - 03:32https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseAVX-512 až se ZEN 4 na 5 nm, zabírají moc místa a papají moc energie a v desktopu nejsou k ničemuhttps://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292225
+
Ale keby dali AVX-1024 a SVE-16384 spolu s 16 ALU, to by bolo!
+1
0
-1
Je komentář přínosný?
Ale keby dali AVX-1024 a SVE
Tomas A https://diit.cz/profil/tomxx
16. 4. 2020 - 13:33https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseAle keby dali AVX-1024 a SVE-16384 spolu s 16 ALU, to by bolo!https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292290
+
To by konečně Crysis běžel plynule i s 64 protivníky!
+1
+2
-1
Je komentář přínosný?
A k tomu 256 jader a 8GB L3
Nalim https://diit.cz/profil/nalim
16. 4. 2020 - 16:54https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuseA k tomu 256 jader a 8GB L3 cache!
To by konečně Crysis běžel plynule i s 64 protivníky!https://diit.cz/clanek/tri-nove-epycy-7fx2-jsou-optimalizovane-pro-vykon-na-jadro/diskuse#comment-1292320
+
Trefa do černého, super!
Ale ja som sa trafil keď mi kolrga odpovedal
>danieel | před 21 hodinami
>Ja pochybuji ze existuje ruzny microcode pro
>ruzne OS.
https://diit.cz/clanek/ryzen-7-3700c-ryzen-3-3250c-pro-chromebooky/diskuse
A dnes AMD pre (pravdepodobne) Zen3 a pokračovateľov zväčšili limit na mikrokód na TROJnásobok (prečo tak divný násobok z pohľadu dvojkovej sústavy. Nárast z 2^12 B na 1,5 x 2^13 B je divné. Prečo nie 2^14?
The Linux Kernel Prepares For Larger AMD CPU Microcode Updates
Written by Michael Larabel in AMD on 15 April 2020 at 06:48 AM EDT.
Future AMD CPUs (more than likely, Zen 3) will be bearing larger CPU microcode sizes, resulting in the Linux kernel needing a change to load them.
Currently the AMD Linux CPU microcode handler has a static upper limit of the page size, which is generally 4K.
With a change now pending as part of the x86/urgent work, that upper limit is being bumped to a factor of three times the page size. In other words, up to 12K microcode update size.
https://www.phoronix.com/scan.php?page=news_item&px=AMD-Larger-Microcode...
Spíš do modrého, řekl bych.
[Pardon, to mělo být pod komentář výše.]
pri ty kapacite l3 na jadro to imo budou x86 procaky s vubec nejlepsim ipc..
Ne, nemají 6x ALU a frekvence se ani trochu neblíží 5GHz.
Jó kde jsou ty časy, když si vzpomenu na p4 a řeči intelu o 10ghz před xx lety...
Tomu Epycu ta obří L3 cache pomohla v jednotkách procent. Vždyť si ten 2P EPYC F namazal na chleba i ThreadRipper se steným počtem jader. To je pro ty mamlasy co si myslí že IPC se zvyšuje zvětšováním L3 cache. Chtěli byste aby nové GPU od AMD měli 2x větší cache a počet CU zůstal stejný? To by bylo kvikotu, že to nemá výkon. Výkon dělají výpočetní jednotky a cache je pomáhá jenom krmit, nic víc.
Hoši, dokud bude mít AMD ubohé 4xALU tak z toho žádný pořádný výkon nedostanou a pořád budou ztrácet 80% IPC na Apple. Už i ten pitomej Cortex A77 v čínských telefonech je širší než Zen2.
A77 - 4xALU+2xBranch …….. 2xLSU+2xStore ……. 2xFPU
Zen2-4xALU...………………….2xLSU+1xStore...…...4xFPU
Nebýt 2x větší FPU tak Zen2 prohrává úplně ve všem. A příští rok budou mít nové ARMy místo 128 bit NEONu 2048-bit SVE2. To chci vidět s čím přijde AMD a Intel. Po 7-mi letech co je AVX512 venku je jeho rozšíření prakticky nulové. Game over x86.
Až na to že vektorová jednotka ARM procesorů má šířku 128 bit, kdežto AMD ZEN 2 256 bit. Taky nejde přímo porovnávat RISC architektura a x86-64. Přidání nových instrukcí nebo jiných jednotek neznamená automaticky nárůst výkonu. Záleží na programátorech.
Ano správně. Přestože Apple A13 používá jen 128-bit NEON instrukce, tak má FPU IPC(PPC) vyšší o 65% než Zen2, který má 256-bit. Podobné jako když Zen2 s 256bit AVX2 drtí Intel s jeho 512bit. Akorát že AMD nemá oproti Intelu náskok 65%.
Ty 2048-bit SVE2 jsou důležité kvůli stabilitě vývoje SW. ARM už žádnou větší šířku implementovat nebude, takže SW který ručně optimalizuješ bude prakticky nafurt. Než se Intel s AMD dohrabou na 2048bit tak mezitím vydají 4 verze AVX což bude znamenat pokaždé znovu SW předělávat. Proto AVX512 prakticky nikoho nezajímá.
Ty gdybys pracoval ve vietnamské večerce, tak mi prodáš i pičifuk a vložky...
S tím že chutnají o 89% líp jak originál hamburger...
"Přestože Apple A13 používá jen 128-bit NEON instrukce, tak má FPU IPC(PPC) vyšší o 65% než Zen2, který má 256-bit. "
Takže A13 pouze se 128b jednotkami zvládne 40 double-precision FP operací na takt?
Žádný serverový procesor AMD, Intel ani IBM nejde přes 4 GHz. U těchto procesorů je důležitá efektivita. ZEN 2 má vyšší IPC než stávající i "nově uvedené" Intel, protože ty mají už několik generací stejné jádro, pro Intel je přidání plochy křemíku daleko dražší. IPC není daná jen počtem výpočetních jednotek a taktem, je to daleko složitější. U desktopových 8. a 10. jader Intelu je TDP udáváno jen pro základní takt, běžná spotřeba je větší a v maximu podle kvality chlazení až 3,35x větší a to bez přetaktování. Podobné to je i u modelů pro notebooky. Intel měl být už dávno jinde a ne na 14+++ nm.
Mně by zajímalo, jestli ten boost u serverových CPU (Xeon, Epyc) je garantován pro všechny jádra a záleží jen na tom, zda se to uchladí. Nebo se ten boost projeví jen u "výběrových" jader.
Pretoze so 6x ALU nebudu stracat cas a sustredia sa rovno na 8x ALU :)
Nejde jen o počet jednotek, je třeba taky uzpůsobit dekodéry instrukcí, předpovědi skoků a zajistit datovou propustnost, jinak se ty jednotky navíc budou víc flákat než pracovat.
nenenenene.. dekodery a prediktory sou k nicemu, jen zabiraj misto, kde by mohly byt dalsi alu.. vic alu, vic adidas..
Presne tak a zaberaju miesto 4096 vektorovym instrukciam
To jako místní experti trvdí, že Apple má 6xALU, ale nemá žádný decode a prefetch? Tak to jo, odborníci k pohledání. Samozřejmě že Apple má 6xALU a k tomu neméně brutálně výkonný prefetch a decode. Apple ukazuje že těch 80% IPC tam je a lze toho dosáhnout. Problém je že AMD ani Intel žádnou podobně výkonnou architekturu nejsou schopni vytvořit, protože Intel seděl 5 let na zadku jako monopol a AMD po uvedení Bulldozeru 5 let bojovalo o přežití.
Myslím že reálný výkon Apple ARM bude možno reálně srovnat s Intel a AMD procesory teprve až na nich pojede stejný software, tj až budou mít procesor aspoň do NTB. Srovnání různé architektury ještě v různém softwaru může být zavádějící. Krásně se to ukázalo při srovnání pracovních stanic Raptor Talos II na linuxu, kdy v něčem byly procesory IBM Power 9 nedostižné a jinde na chvostu.
No co se týče Linuxu a spousty aplikací, tak to není problém ...
Jen výkon ARM Apple tam jaksi není vidět, ale možná jsem málo hledal
Těžko hledat, co existuje výhradně ve vlhkých Richieho snech ;-)
Nie, miestni exprerti tvrdia, ze az Apple CPU bude porovnatelne s Intel a AMD vo VSETKYCH typoch HPC zataze (nie len tych par, ktore si si ako modlu vybral a ktorej svedci vyssi pocet ALU), mozme porovnavat jeho efektivitu a architekturu. Pretoze je nutne si uvedomit, ze zvysovanie IPC od urcitej hranice vyzaduje (zjednodusene povedane) exponencialne naklady na zdroje a ARM to len teraz zacne mat tazke v dotahovani sa.
Az Apple procesor bude mat dostatocne velku cache, bude podporovat velky pocet RAM modulov, multi-socket systemy, bude mat naozaj vela jadier, atd atd. mozme zacat porovnavat, za akych podmienok (cene/spotrebe/...) to dokazal. Dovtedy je to len vlhky sen.
Inak keby Apple CPU bol skutocne tak dobry, ako hovoris, uz davno nahradi Intel vo VSETKYCH svojich produktoch a zacne ho tlacit aj do HPC segmentu.
Multi socket systémy a vyměnitelná RAM zní jako něco z devadesátých let. Na vše stačí iPhone.
To by ste to dopracovali..
vypnuté väčšinu prediktorov znižuje výkon CPU o cca. 93%
Google Engineer Shows "SESES" For Mitigating LVI + Side-Channel Attacks - Code Runs ~7% Original Speed
on 21 March 2020
Čisto iba lfence na intel only chybu LVI výkon -78%..
LFENCE barrier instruction around loads, indirect branches, and RET instructions. The tests on Kabylake found that the mitigated performance overall was about 22% that of the performance without the LVI mitigations.
Google engineer in working to avoid LVI and other side-channel vulnerabilities in one of her tests saw just ~7% the original performance based on the geometric mean.
https://www.phoronix.com/scan.php?page=news_item&px=LLVM-SESES-Mitigatin...
Ale Tom si dela prcu z mistniho saska Richieho, ktery tlaci mantru 6xALU = singularita je zarohem :D
"vypnuté väčšinu prediktorov znižuje výkon CPU o cca. 93%"
Ano, všichni pamatujeme Itanic. :D
U Itania šlo o naprosto odlišnou architekturu velmi širokého jádra, kde optimalizaci kódu měl na starosti kompilátor. A to byl celý problém. Že na vydávání nových CPU Intel ke konci dlabal, bylo dané tím, že v tom už tak utopil hodně peněz. Ale neúspěšných projektů měli v minulosti víc.
Ano, vždyť o tom to je - ukázalo že, spoustu věcí staticky v kompilátoru řešit nelze. Ty obvody navíc tam mají svůj smysl.
Intel to chtěl zabalit dřív, ale HP si soudně zajistilo, že něco ještě vydají, protože prodali HW nějakým zákazníkům, kteří chtěli v rámci Itanium rodiny upgrade a podporu.
A hele jak se daří ladit 7nm u TSMC.
Že mně výčet těch firem vůbec nepřekvapil. Epycy 7Fx2 jsou jak dělané pro OS v cloudu. Hodně lidí v tom vidí budoucnost IT. AMD nechce zůstat pozadu.
Homeoffice zažívá ohromný boom díky pandemii. Takže přišli na trh v pravý čas.
Nikde nevidím podporu AVX-512 ?
Protože jsou to fyzicky stejné EPYC Rome, jen mají jinou konfiguraci L3 cache, aktivních čipletů, frekvence a TDP.
AVX-512 až se ZEN 4 na 5 nm, zabírají moc místa a papají moc energie a v desktopu nejsou k ničemu
Ale keby dali AVX-1024 a SVE-16384 spolu s 16 ALU, to by bolo!
A k tomu 256 jader a 8GB L3 cache!
To by konečně Crysis běžel plynule i s 64 protivníky!
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.