Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k GCC 9.0 odhalil tři nové instrukce Zen 2

Nutnost novych instrukci pro Zen2 nechapu, nereknu ty 3 zverejnene, ty byt samozrejme mohou, ale proc by se melo menit v clanku naznacenych polovina instrukci?
To ma Zen1 ty instrukce tak spatne?

+1
-1
-1
Je komentář přínosný?

Nehledejte v tom nic podstatného, normální článek napsaný AMDfilem, pokud by byl článek o Intelu dočetl byste se, že Intel přidal tři nové nepotřebné instrukce a celkově upadá , neví co dál a na víc se nezmůže, protože je to o AMD dozvíte se, že přidal tři instrukce, je to jen začátek a pokračování bude boží, velké a geniální.

+1
-8
-1
Je komentář přínosný?

Me presne tohle taky hned napadlo, ale na druhou stranu jsem to nepochopil v tom, ze sam si myslim, ze Zen1 se hodne moc povedl a nemyslim, ze by byl nutne duvod nejak menit instrukce pro Zen2. Proc by tam proste nemohli pridat jen ty 3 zverejnene instrukce?

Proste sam jako fanousek Zenu se ptam, proc by se mely instrukce menit?

+1
0
-1
Je komentář přínosný?

Nie meniť ale pridávať.

Dovolím si úvahu, ktorá nemusí byť správna..

RDPID, má už Intel a v podstate umožňuje lepšie plánovať úlohy pre OS- vhodné pre veľa jadier a na rozlíšenie, či ide o CCX alebo iné usporiadanie. A aj, aby sa zabránilo zneužiteľnosti Spectre 2a a 3a, ktorými AMD nie je postihnuté.
https://hjlebbink.github.io/x86doc/html/RDPID.html

WBNOINVD is used for writing back all modified cache lines from the processor's internal cache back to the main system memory while not invalidating/flushing the internal caches.
https://www.phoronix.com/scan.php?page=news_item&px=Icelake-WBNOINVD-PCO...

Keď sa to dobre použije tak sa to dá použiť ako umelo pridaná inštrukcia logikou CPU pri potvrdení, že vetva v špekulatívnom režime bola správna.. Ak sa totiž v prípade neprávnej predikcie vloží to isté ,ale s vynechním slova not v "while not invalidating/flushing the internal caches", tak vlastne nemá útočnik ako zistiť , čo to boli za dáta, ktoré hľadal, teda ak navyše všetky stránky, ktoré sa čítajú
v špekulatívnom režime sa označia ako modified..

CLWB
Writes back to memory the cache line (if modified) that contains the linear address specified with the memory operand from any level of the cache hierarchy in the cache coherence domain. The line may be retained in the cache hierarchy in non-modified state. Retaining the line in the cache hierarchy is a performance optimization (treated as a hint by hardware) to reduce the possibility of cache miss on a subsequent access. Hardware may choose to retain the line at any of the levels in the cache hierarchy, and in some cases, may invalidate the line from the cache hierarchy. The source operand is a byte memory location.
https://www.felixcloutier.com/x86/CLWB.html

Toto je v podstate podobné, ako predchádzajúca, len s postupným zápisom.

V podstate, ak sa to použije, ako som napísal, o rýchlejšiu náhradu IBRS a IBPB, lebo tým sa vynúti zmena dát v RAM, a tá sa pri nesprávnej špekulácii opraví/vráti späť.

+1
+5
-1
Je komentář přínosný?

> proc by se mely instrukce menit?

Instrukce se nemeni, maximalne se muzou zmenit jejich latence/propustnost. Jinak se muzou se jen pridavat. Kdybys totiz nejakou zmenil, tak existujici software ti zacne delat blbosti. Vim o jednom pripade zmeny instrukce (BTW u intelu), a samozrejme dusledek byl ze software zacal delat blbosti. K obrane Intelu musim rict, ze Intel vyslovne nespecifikoval tu vlastnost, kterou zmenil, takze chyba byla na strane vyvojaru, kteri predpokladali ze je ta vlastnost vytesana do kamene.

Jinak jsou ty zmeny ciste spekulace. Nekteri ocekavaji AVX512, IMO to AMD momentalne nema zapotrebi - v serverech je lepsi nez Intel vyrobnimi naklady, poctem PCIe linek i pametovymi kanaly. Neni lepsi s kazdym softwarem, ale najde si spoustu zakazniku, stejne jako TR. AVX512 je tuna kremiku a penez na vyvoj - IMO spis zalezitost Zen 3/4.

Osobne predpokladam, ze hlavne vylepsi latence a propustnost instrukci, zvlast u AVX/AVX2. To samo o sobe by mohlo stacit na prumerne zlepseni IPC o tech 10-15%.

+1
+3
-1
Je komentář přínosný?

Peter Fodrek a franzzz: ok, dik za vysvetleni.

V clanku to je divne napsane, jinak si myslim, ze AMD zadne vyjma tech 3 instrukce pridavat nemusi. Jak pise franzzz vylepsi se latence a propustnost.

+1
0
-1
Je komentář přínosný?

Nemáte za čo.

+1
0
-1
Je komentář přínosný?

Osobne bych ocekaval, ze zvyseni propustnosti AVX(2) pujde ruku v ruce s AVX512. Nema smysl pridavat AVX512 bez zvyseni propustnosti (ctvrtinovy vykon by byl fakt uz extrem) a naopak, pokud by uz rozsirili vypocetni jednotky na 256-bitu, tak pridani AVX512 by nemelo byt zase tak narocne - vlastne by slo jen o zmenu (byt velkou) v dekoderu.

+1
+2
-1
Je komentář přínosný?

> Nema smysl pridavat AVX512 bez zvyseni propustnosti

To je pravda, jenomze potrebujete nejen zvysit propustnost a zlepsit latence instrukci, ale taky rozsirit vsechny cesty, aby jste mel cim krmit ty jednotky...

> vlastne by slo jen o zmenu (byt velkou) v dekoderu

Obavam se ze az tak jednoduche to nebude. Jednak je otazka, kolik by to pridalo plochy kremiku - IMO docela dost, takze by mozna musely cely chip prekopat a lip optimalizovat z hlediska plochy, aby to s AVX512 melo rozumne vyrobni naklady. Za druhe se musi taky zcela prekopat rizeni spotreby. Takze "jen" zmena v dekoderu to neni...

+1
0
-1
Je komentář přínosný?

Zvysenim propustnosti jsem myslel predelani soucasnych 128b jednotek na 256b, samozrejme vcetne vsech prislusnych datovych cest. S instrukcni sadou to az tolik nesouvisi. 256-bitove AVX instrukce by se uz v dekoderu nemusely rozkladat na dve 128-bitove, jako u Zen1. Tohle by prave byla ta velka zmena, ktera by si vynutila predelani layoutu a rizeni spotreby. Podpora AVX512 (tedy predevsim EVEX formatu instrukci) v dekoderu by uz pak byla relativne jednoducha. 512-bitove instrukce by se samozrejme opet rozkladaly na dve 256-bitove - stejne jako u Cannon Lake. A co se tyce latence instrukci, tak to je uplne nezavisla velicina, ktera pri rozsireni jednotky zustava stejna (je to dobre videt napr. u 256b Skylake vs 512b Skylake-X) a dneska uz se moc nemeni.

Jinak bohuzel to vypada, ze Zen2 bude mit stale jen 128-bitove jednotky, tedy ani AVX512 (ne, ze by to neslo, ale byl by to nesmysl). Rozsireni na 256bit + AVX512 bude nejspis nejdrive az v Zen3.

+1
0
-1
Je komentář přínosný?

>kdybys totiz nejakou zmenil, tak existujici software ti zacne delat blbosti

Ja si pamätám viac, a z oboch strán, a dokonca Intel a AMD zabúdali iné opkódy, aby ich uvoľnili pre budúce použitie. Ale to sa už dávno neudialo a išlo o nepoužívané alebo extrémne málo používané opkódy

nič lepšie toto som, ako dôkaz, nanšiel

Assembly: why some x86 opcodes are invalid in x64?

...the opcodes for changing and accessing them were removed.

The FS and GS segment registers can still set the base address in 64-bit mode, so the opcodes related to them have not been removed.

https://stackoverflow.com/questions/30938318/assembly-why-some-x86-opcod...

+1
0
-1
Je komentář přínosný?

Tak to je neco jineho nez jsem mel na mysli ja. Tady se AMD pri navrhu x86-64 rozhodlo, ze vyhodi par instrukci ktere nedavaji smysl. To je naprosto v poradku - zadny software pouzivajici tenhle mod procesoru jeste neexistoval, a v 32bit modu ty instrukce funguji nadale uplne stejne. Kdyz se dela uplne novy "mod" behu procesoru, tak dava smysl delat vetsi zmeny, protoze stejne se bude muset vsechen software prelozit na ten novy mod. Ja kdyz mluvil o tom ze se instrukce nemeni, mam na mysli to ze by jste zmenil existujici instrukci v nejakem existujicim modu procesoru.

+1
+2
-1
Je komentář přínosný?

Larabel je amdfil? (: no tak to slysim prvne..

'' It's possible there might be some other new instructions supported by Zen 2 that AMD doesn't want to reveal at this time, just like the scheduler cost tables haven't yet been tuned, etc. This patch is basically a starting point so the GCC 9.1 stable update due out in 2019 can at least handle -march=znver2 and that march=native targeting will also work for these next-gen AMD processors. ''

ty ses fakt dobrej magor.. bez si ho oplachnout vlaznou vodou a vem si prasky, kdyz chytas hysteraky i z normalni newsky.. ((:

+1
+4
-1
Je komentář přínosný?

Tak jestli o nekom tvrdi, ze je AMDfil, tak o nem by se dalo v klidu prohlasit, ze je AMDmagor :))
A ze se tady pravidelne takovy objevuji, kteri za vsim vidi spiklenectvi AMD fanousku...

+1
+4
-1
Je komentář přínosný?

Jediny, kdo v tom hleda neco podstatneho, jako ze nejakou "filii", atp. jses jen ty.

Nikde tam neni napsane nic o bozim, genialnim pokracovani. Je tam napsano, ze je se predpoklada, ze je to prvni vlastovka.

Nepoklepavas rapidne nohou kdyz ctes neco na DIIT? :-)

+1
+2
-1
Je komentář přínosný?

A to, že by se mělo něco dít s polovinou instrukcí vidíte v článku kde? Ať koukám, jak koukám, nic tam nevidím, ani náznak.

+1
+4
-1
Je komentář přínosný?

"Myslím ale, že za bezpečný odhad můžeme považovat interval začínající březnem a končící červnem 2019."

Souhlasim, 67% je slusna pravdepodobnost a pokud uplne vyloucime leden, tak bude 80%.

+1
0
-1
Je komentář přínosný?

on je január=leden medzi marcom=březnem a júlom= červnem?

A január nejde vylúčiť ...

AMD President and CEO Dr. Lisa Su to Keynote at CES 2019
Dr. Su to explore the accelerating adoption of high-performance computing and visualization technologies to redefine life
Arlington, VA – 10/03/2018 – The Consumer Technology Association (CTA)TM today announced that AMD (NASDAQ: AMD) President and CEO Dr. Lisa Su will deliver a keynote address at the upcoming CES® 2019. Dr. Su’s address is scheduled for Wednesday, January 9 at 9:00 AM in the Venetian Palazzo Ballroom. Owned and produced by CTA, CES 2019, the world’s largest innovation event, will run January 8-11, 2019 in Las Vegas.

Dr. Su’s address marks the first CES keynote from AMD in show history.

She joins IBM chairman, president and CEO Ginni Rometty as confirmed CES 2019 keynote speakers.
https://www.ces.tech/News/Press-Releases/CES-Press-Release.aspx?NodeID=e...

+1
0
-1
Je komentář přínosný?

Jedná se o odhad vydání. AMD tvrdí leden až červen tj. 6 měsíců. no-X to zúžil na 4 měsíce. Tzn. vybral 67% z období uvedeného AMD. Vzhledem k tomu, že se nejedná o náhodný jev a že AMD zvolila poměrně dlouhé období(pololetí místo čtvrtletí, začátku roku) si troufnu spekulovat, že to určitě nebude v lednu, tudíž to no-X moc nezúžil(80%).

Osobně bych to viděl na 2. čtvrtletí, ale AMD to nechce přiznat udržuje napětí.

P.S.
Samozřejmě může je vydat v lednu a celé je to jenom mlžení, aby si neutnula prodeje, ale tak nějak této variantě moc nevěřím.

+1
0
-1
Je komentář přínosný?

Pokud by uvedení mělo znamenat reálnou dostupnost, tak nejbližší možný termín bych viděl tři měsíce po slavnostním prohlášení TSMC, že 7nm produkce opustila rizikovou výrobu a běží na plné obrátky. Tu událost jsem zatím nepostřehl.

+1
0
-1
Je komentář přínosný?

vzhľadom na to, že sa robí v TSMC 7nm 2. generácie a majú komerčnú produkciu na 2. generáciu od 22.6.2018. Ak by AMD začalo vyrábať desktop Zen v prvý deň komerčnej 7nm výroby, tak by išiel na trh 29.11.2018(testovanie produkcie muselo byť ukončené 30.10.2018- a 25. alebo 26..
10.2018 AMD sa o 7nm Vega20 vyjadrilo..)

Lenže ako Vega20, tak prvý Zen2(Epyc 2) pôjdu do serverov, takže to bude neskôr, ale CES 2019 by stihnúť mali.. (6.11.2018 má AMD akciu: 26. 10. 2018 7nm Vega 20-K vydání by mělo dojít „brzy“ a Lisa Su dále slíbila zveřejnit „mnohem více detailů 6. listopadu“. https://diit.cz/clanek/amd-brzy-uvede-prvni-7nm-produkt)

TSMC: First 7nm EUV Chips Taped Out, 5nm Risk Production in Q2 2019
October 9, 2018 4:00 PM EST
https://www.anandtech.com/show/13445/tsmc-first-7nm-euv-chips-taped-out-...

TSMC starts 7nm commercial production

Jun. 22, 2018

https://seekingalpha.com/news/3365810-tsmc-starts-7nm-commercial-production

AMD má 40 dní výroba 90 dní testovanie a 30 dní pred uvedením desktop produktu dodávky OEM(splky 160 dní). Pre server to bude viac. Otázka je o koľko? lebo prvé 7nm Zen2-ky budú Epyc-i.

our starting date is June 22, 2018 so that means that 160 days later would be November 29, 2018.

https://www.convertunits.com/dates/160/daysfrom/Jun+22,+2018

+1
0
-1
Je komentář přínosný?

Je nabíledni, že vše, co umožní vyšší odbyt v korporátu (tedy i imunita vůči problémům jako byl ten se Spectre) při předpokladu ochlazení SOHO poptávky se počítá a v tomto je úsilí AMD zcela v kontextu a tudíž pochopitelné. Nikoli spekulace ohledně termínů dostupnosti, ale otázka cenová je ta, která bude v příštím roce mnohem důsležitější než nějaké potenciálně dále dodatelné vlastnosti.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.