Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Epyc 2 Rome je rychlejší než dva Xeony 8180M, IPC má až o 29 % vyšší než Zen 1

"Návrh PCIe 4.0 řadiče a rozhraní pro 14nm proces totiž nemusí existovat a AMD se nevyplatí jej kvůli jedinému produktu financovat."

PCIe Gen 4.0 maji uz rok tyto produkty:
- 14nm IBM Power 9
- 16nm Xilinx Ultrascale+

A pak se najde par dalsich mensich zarizeni jako sitovky, ssd a switche. Typicky se to jadro licencuje a pokud je to soucasti CPU chipletu, tak si to AMD muselo udelat samo na tech 7nm (je mala sance, ze by si to licencovali navzajem se Xilinxem, ktery to ve svem 7nm Everestu jiste bude mit take)

+1
+6
-1
Je komentář přínosný?

To je nějakej bordel, takže PCIe nebude používat cache na I/O čipletu? Nebo tam žádná nebude?? A každej čiplet bude obsluhovat 16 linek? Takže si CPU čiplet něco natáhne do L2/3 cache a pak mu tam pro to budou ostatní sahat nebo to rovnou bude muset zkopírovat do L3/4 victim cache na I/O čipletu? Slušnej peklostroj postavili...

+1
0
-1
Je komentář přínosný?

> PCIe nebude používat cache na I/O čipletu?

PCIe je sbernice, tj vec urcena na prenos dat. Vseobecne hardware urcen na prenos ma buffer jenom tak velky, aby byl prenos "hladky". Nejak nevidim duvod a smysl aby bylo PCIe pripojeno na L3/L4/Lx cache. Trebars kdyz chci prenaset gigabajty dat primo mezi dvema zarizenimi na PCIe, bude to cpat ty data do cache zatimco CPU s ni pracuje ? Jaky by to melo smysl ? Akorat stezite praci CPU. A i kdyby jste prenasel PCIe -> RAM, kdyz prenesete 1giga, tak v cache by vam zustalo poslednich par mega. Myslite ze vam tech par mega nejak pomuze ?

BTW, uz na nynejsich procesorech existuji "streaming" instrukce, ktere zcela obchazeji cache a prenos je primo do RAM. Kdyz prenasite 100x vic dat nez je velikost cache, vubec nema smysl to pres ni cpat.

+1
+5
-1
Je komentář přínosný?

V kazde transakci na PCIe zbernici je priznak "No snoop", ktery rika, ze cteni nebo zapis ma jit primo do pametoveho radice a s CPU cache se nema praovat. Pri nastaveni NS=1 se typicky v starsim systemu s oddelenym NB (pametovym radicem) nemuselo vubec NB tazat CPU, zda tyhle adresy ma v cache nebo nema, takze vykonani transakce bylo rychlejsi. Pri nastaveni NS=0 se to muze, ale nemusi cache dotazovat. PCIe nema zadny rezim k vynuceni koherence cache.

Prenos mezi dvouma zarizenima (napr. DMAdirect na Quadro) probiha nejkratsi moznou cestou v PCIe strome. Tudiz SB/NB/CPU ani nemusi onu transakci videt a logicky cpu cache na ni nema vliv.

+1
+3
-1
Je komentář přínosný?

No to jsou jasné úvahy (obě), které mě taky napadly: do jaké míry je PCIe řadič jen správce toho rozhraní (pominu situaci, kdy je ještě PCIe řadič jako multiplexer čip někde poblíž slotů) a jestli když potřebuje CPU něco z PCIe (= zkomprimovat data na SSD, převést videosoubor), tak to vždy jde přes RAM nebo i streamovaně přímo do cache (CPU) a výsledek jde hned zpět (protože procesor je mnohem rychlejší než sběrnice, většinou). Zda PCIe řadič je jen řadič nebo i vyústění datových linek, že. Pak je otázka, které situace to ovlivní do plusu a které do mínusu, kdyby řadič byl/nebyl na I/O.

+1
0
-1
Je komentář přínosný?

Konkretne v pripade SSD se jedna o "hw api" AHCI nebo NVME a obe operuji s ukazateli do pameti (je tam fronta operaci a odkazuje se to na data - pomoci fyzicke adresy). Pokud dobre vim, tak zadny OS nemapuje CPU cache jako separatni adresni prostor, na ktery by se pak dalo odkazovat a pristupovalo by k nemu PCIe zarizeni primo. Vzdy to jde z/do operacni pameti, nebo mezi zarizenima (tj. z/do pameti zarizeni). Proto je taky CPU cache transparentni.

Z pohledu rychlosti by sis nepomohl - Gen3 x 16 PEG slot ma 128Gb/s. 2ch DDR4 2400 je 128b * 2400MT/s = 307Gb/s. Takze ono se to vse stihne presunout do pameti i z pameti a zadne degradace si nevsimnes.

S tim jak delam dost s PCIe me taky napadlo hledat zpusoby, jak rozjet CPU+FPGA propojeny skrze PCIe bez nutnosti mit RAM.. protoze treba na nejake streamovane zpracovani dat bych si opravdu vystacil s desitkama MB cache ktere cpu maji. Ale moc to nema reseni - CAR (cache as ram) funguje jen pro prvni cast biosu a co nejdriv se inicializuje RAM (at uz kvuli iGPU nebo prave periferiim).

+1
0
-1
Je komentář přínosný?

@no-X: Jirko, jak je to s počtem SIMD jednotek a jejich šířkou na současných CPU SkyLake/CoffeeLake? ZEN 2 má nově 2× 256bit SIMD (ZEN/ZEN+ jen 2× 128bit SIMD). Znamená to, že dotáhli Intelí CPU po stránce výkonu pro AVX/AVX2 instrukce?

Jestli nakonec vyjde IceLake, tak se dočkáme AVX512 i pro desktop. Zajímavé je, že bude podporovat více instrukcí než CascadeLake:
https://twitter.com/InstLatX64/status/969560033922035713

+1
0
-1
Je komentář přínosný?

„Znamená to, že dotáhli Intelí CPU po stránce výkonu pro AVX/AVX2 instrukce?“

To myslím ukážou až testy…

„Jestli nakonec vyjde IceLake, tak se dočkáme AVX512 i pro desktop.“

Pokud nebude pro desktopové produkty vypnutý.

+1
+3
-1
Je komentář přínosný?

>Xeon 8180M aktuálně stojí kolem $10 500 za kus,

Môžem vedieť zdroj ceny ? To musí byť niekto s extrémnou zľavou

Intel CPU Price List (s linkom na aktuálne platný cenník)
https://www.intc.com/investor-relations/investor-education-and-news/cpu-...

Intel® Xeon® processor 28, 26, 24,22, 20, 18, 16, 14, 12, 10, 8, 6 and 4 core versions
Server/Workstation (FC-LGA14)
Price Oct'18 (10/08)

8180M (38.5M cache, 28 Cores, 56 Threads, 2.50 GHz (205W) 10.40 GT/sec Intel® QPI)
$13,011
https://s21.q4cdn.com/600692695/files/doc_downloads/2018/Oct_08_18_Recom...

za kus pri odbere v tisícoch kusov..

Edit:
Toto rozhodne bude najdrahší CPU od AMD, ktoré už nemá svoj cenník, ale len cenník svojich distribútorov napr. v GER a najdrahší

AMD EPYC 7000 Series AMD EPYC 7601 From € 4387.98 /kus
https://www.amd.com/en/shop/de/Processors?f%5B0%5D=product_family%3A2311

+1
+2
-1
Je komentář přínosný?

Aspoň vidno, aké obrovské zľavy ponúka Intel veľkým odberateľom, a keď pohrozil zrušením/ znížením zliav, ak budú dodávať viac % systémov s AMD, tak veľmi rýchlo od zámeru odskočili,

Intel zatím miliardovou pokutu EU platit nemusí
14. 9. 2017
Tím samozřejmě není řečeno ani že bude Intel obvinění zproštěn, ani že bude rozsudek opět potvrzen.

Připomeňme, že Intel se dle EK měl podbízet slevami gigantům Dell, Lenovo, Hewlett-Packard a NEC a také evropskému distributorovi komponent.
https://diit.cz/clanek/intel-zatim-miliardovou-pokutu-eu-platit-nemusi

+1
+4
-1
Je komentář přínosný?

> pohrozil zrušením/ znížením zliav, ak budú dodávať viac % systémov s AMD, tak veľmi rýchlo od zámeru odskočili,

No jsem zvedav co Intel vymysli ted. Protoze situace je trochu jina nez v minulosti. Za prvni nemaji o dve tridy lepsi vyrobni proces nez ostatni, a IMO uz ho ani nikdy mit nebudou. Za druhe uz nemaji zadne kraliky ktere muzou vytahnou z klobouku v podobe narustu IPC nebo frekvence. Vseobecne se kraliky z toho klobouku nyni tahaji dost tezko.

"Slevy" a podrazactvi muze fungovat nejaky cas, ale long-term plan to zrovna neni, a IMO to vypada ze AMD ted bude schopne hezkych par let nabizet 90%+ tak dobre procaky jako Intel. Navic jsou tady dalsi ze, takove Cavium X2 ma IPC na urovni Broadwellu, za par let muzou dotahnout Intel a pak bude veselo...

+1
+5
-1
Je komentář přínosný?

„Za druhe uz nemaji zadne kraliky ktere muzou vytahnou z klobouku v podobe narustu IPC nebo frekvence. Vseobecne se kraliky z toho klobouku nyni tahaji dost tezko.“

https://youtu.be/EAZi1c083gw?t=20 ;-)

+1
+6
-1
Je komentář přínosný?

...aaa pán je Sharpista ;)

+1
+1
-1
Je komentář přínosný?

Podívejte se na výsledky toho testu se současnýmy procesory - 2x 16-jádrový Xeon GOLD je 25% pomalejší než 2x 16-jádrový EPYC. Je to prostě klasický cherry-picking.

+1
0
-1
Je komentář přínosný?

Vyberať čerešničky by bolo niečo iné

Double the compute performance per socket(4) and four times the floating point performance per socket(5) compared to current AMD EPYC processors.

4. Testing performed by AMD Engineering as of October 2018 using AMD reference system with a pre-production “Rome” engineering sample, where “Rome” scored approximately 2x higher compared to “Naples” System.

5. Estimated generational increase based upon AMD internal design specifications for “Zen 2” compared to “Zen 1”. “Zen 2” has 2X the core density of “Zen 1”, and when multiplied by 2X peak FLOPs per core, at the same frequency, results in 4X the FLOPs in throughput.
https://www.amd.com/en/press-releases/2018-11-06-amd-takes-high-performa...

+1
+1
-1
Je komentář přínosný?

Takže vybrat test, ve kterém o čtvrtinu výše taktovaný xeon se stejným počtem jader je o čtvrtinu pomalejší než EPYC není vybíraní třešinček? (mluvím o současné generaci EPYCu!)
Pokud by to byl standardní výsledek pro současnou generaci, neměl bych nic proti. To se ale snad nesnažíš říct.

+1
0
-1
Je komentář přínosný?

Peter Fodrek je český internetový troll (pro mě) nového druhu.
Není důležité, co se snaží říct. Hlavně se snaží něco říct. Jeho sledování má (zatím pro mě) 4 fáze:
1. Nejdříve zaujatě čtete, čtete, a nakonec zjišťujete, že tomu úplně chybí nějaké sdělení.
2. Pak už si ho zapamatujete a přeskakujete.
3. Už vás začne štvát, že se vyskytuje prakticky v každé diskuzi, a jeho přeskakováním zkracujete diskuzi na polovinu. Navíc vlákno navazující na Fodreka je už nenávratně zkažené. Tak začnete trolit Fodreka.
4. Ani to vás neuspokojí, protože Fodreka neutrolíte, a už jen litujete ty, co se stále snaží. Tam jsem zatím skončil.

+1
+3
-1
Je komentář přínosný?

>český internetový troll
>se vyskytuje prakticky v každé diskuzi,

Je to menej ako 3% diskusií na 6 weboch, kde som

+1
0
-1
Je komentář přínosný?

Člověče, vy jdete do sebe. Tak krátký příspěvek jsem od vás nečetl, navíc chybí jediný anglický výraz nebo odkaz.

S tou statistikou jste mě překvapil. Jako že si ji vedete. Že na vás narážím každou chvilku, to je jiná věc.

+1
+1
-1
Je komentář přínosný?

Jako troll se chováte ve 100 % Vašich příspěvků. Jen jste obtížněji uchopitelný, protože pokud si Váš příspěvek přečte někdo lokálně neznalý, je možné, že se poškrábe na temeni a začne přemýšlet, jetli náhodou část Vašeho sdělení nedává náhodou smysl.

Ale jen pokud od Vás nikdy nic nečetl. Průměrný čtenář tohoto konkétního webu Vaše komentáře (duševní zdraví je jen jedno) přeskakuje.

A to je Vaše síla Fodreku! Užívejte jí s rozumem! Možná Vás budeme jednou potřebovat při boji s xyz! XYZ je nejhorší!

+1
0
-1
Je komentář přínosný?

Proč ad hominem? K věci nic?

+1
-1
-1
Je komentář přínosný?

Proč ad hominem?
K věci píšu, co se Peter Fodrek snaží nebo nesnaží svým příspěvkem říci.

Nikde nepíšu, že Fodrek píše nesmysly, nebo to tam někde najdete? Jeho příspěvky nemají pointu, nebo je velmi obtížné je nalézt, zato jsou sáhodlouhé. Tolik k jeho kritice. K definici "ad hominem" mi chybí, že se snažím vyvrátit nějaké tvrzení, nebo poukazuji na autorovy nedostatky. Pouze kritizuji způsob psaní jeho příspěvků, a to vcelku věcně, a ano, nazval jsem ho trollem, což nepovažuji tolik za urážku, jako spíš zařazení do určité skupiny diskutérů.

+1
+2
-1
Je komentář přínosný?

V podstate souhlasim, ale uplne za trolla bych ho neoznacil. Cetl jsem, ze ten jeho styl je profesionalni deformace.

+1
+2
-1
Je komentář přínosný?

>Pokud by to byl standardní výsledek pro současnou generaci, neměl bych nic proti.

Za predpokladu, že ten benchmark skompilujte vždy s vhodným kompilátorom a vhodnými parametrami pre daný CPU a daný typ testu , tak sú.

Problém je, že medzi kompilátormi
https://www.phoronix.com/scan.php?page=article&item=llvm3_gcc_open64&num=2

aj medzi nastaveniami optimalizácií na to istom kompilátore
https://www.phoronix.com/scan.php?page=news_item&px=MTc2NDg

ako aj vo výkone kódu optimalizovaného na konkrétny CPU bežiaceho na CPU od konkurencie
https://www.pgroup.com/lit/presentations/pgisc06.pdf

sú priepastné rozdiely vo výkone a tým pádom v benchmarkoch..

+1
0
-1
Je komentář přínosný?

Není vybírán extrabuřt, ale něco, co ukazuje, že při výběru srovnatelných kousků lze předpokládat rozdíly mnohem větší. To by z techlologické logiky věci mělo platit. Takže žádné cherry-picking :)

+1
+2
-1
Je komentář přínosný?

Je to na hry?

+1
-4
-1
Je komentář přínosný?

Asi jako vy.

+1
+2
-1
Je komentář přínosný?

Třeba na slepou bábu?

+1
+2
-1
Je komentář přínosný?

Hodna uspora penez, vykonnejsi a modernejsi, necht se AMD jenom dari, jenom ty ovladace lip vypilit, posledni Adrenaliny by totiz mohli byt lepsi, nejprv otestovat, pote vypustit na svet.

+1
0
-1
Je komentář přínosný?

viď. nižšie..

+1
0
-1
Je komentář přínosný?

Hlavne je to prekopané

trvalo mi to dva dni, ale docvaklo mi to

>measured at 4.53 IPC for DKERN
>+RSA compared to prior “Zen 1”
>generation CPU (measured at 3.5 IPC
>for DKERN + RSA)

Zen mal síce 8 výpočtových pipeline. Address Generating Unit nepočitam za výpočtovú. 5 plánovačov/schedulerov, ale len štvorcestný dekóder.

edit
https://en.m.wikipedia.org/wiki/Zen_(microarchitecture)#/media/File%3AZen_microarchitecture.svg
end edit

Tým pádom IPC <= 4 Zen má 3,5
IPC=4,53 nikdy nebude so štvorcestným dekóderom, teda bude minimálne päťcestný...

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.