Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Intel mluví o desktopových i serverových procesorech s podporou AVX10

Ano v NovaLake se údajně vrátí AVX10(AVX-512) a to i do malých jader...
Ale je to za dva roky, bude to ještě někoho zajímat?
A za jakou cenu to bude s tím krvavým 2nm procesem...?

+1
+5
-1
Je komentář přínosný?

AVX 10.1 mělo být v Xeonech jako přechodová verze. Aby se nové věci už psaly a ladily pro AVX 10.

Otázkou je kdo bude přepisovat, nebo alespoň kontrolovat kompatibilitu všěch věcí, co už byly napsány pro AVX-512.

+1
+2
-1
Je komentář přínosný?

Mno a není AVX-512 víc, než AVX-10? 😁 Víc pruhů, víc Adidas, ne?

+1
0
-1
Je komentář přínosný?

Jestli je "vic" nevim, ale hardwaru s podporou AVX-512 bude rozhodne vic.

Nez se objevi prvni realni hardware s AVX10, budou existovat minimalne 3 generace Zen (v laptopech/desktopech/serverech) s podporou AVX 512. Navic pokud vim tak i pristi generace konzoli bude mit AVX512 (protoze Zen 5). To jsou desitky ne-li stovky milionu procesoru. Tipuji, ze AVX10 bude existovat par generaci CPU a pak potichu udelaji otocku zpatky k AVX512, protoze to AVX10 bude drtiva vetsina vyvojaru totalne ignorovat, a navic pokud chce Intel jit zpatky k unifikovane architekture jader, tak to vlastne cele postrada smysl.

Co se tyce vektoru, meli by se oba vyrobci x86 spis zamerit na "scalable vectors" jako ma ARM nebo RISC-V. Delat novou nekompatibilni sadu instrukci pokazde, kdyz chcete vetsi vektory, je proste hloupe.

+1
+2
-1
Je komentář přínosný?

Avx 512 je podmnožina instrukcí avx 10.2, takže to co je napsané pro avx 512 bude fungovat pro avx 10.2

Roztříštěnost instrukcí byla právě důvodem vzniku avx 10 resp avx 10.2

+1
-5
-1
Je komentář přínosný?

Myslel jsem že AVX 10 byla obezlička Intelu jak dostat AVX na Atomová jádra a nevykrvácet na ploše křemíku. Proto měla první verze 256bit.

Nyní už to vypadá čistě jako truc projekt proti AMD.
Další fragmentace. Už mají dvě verze a pořád to žádný HW nepodporuje. Bylo by od slibotechny Intelu pěkné, nejdřív implementovat současný stav AVX512.

+1
+9
-1
Je komentář přínosný?

Truc projekt to samozřejmě byl. viz. ty 2 instrukce přidané jen aby Zen neměl Full podporu.

A s tím fungováním AVX-512 kódu, nebo i AVX-2 ... to v praxi tak bledě modré nebude.
https://cdrdv2.intel.com/v1/dl/getContent/784343

Třeba tohle moc pozitvně nevypadá:
- Intel AVX2-compiled applications, re-compiled to Intel AVX10, should realize performance gains
- Existing Intel AVX-512 applications should see the same performance when compiled to Intel AVX10

+1
0
-1
Je komentář přínosný?

Tahle Intel iniciativa je normální EEE (Embrace, Extend, and Extinguish) https://en.wikipedia.org/wiki/Embrace,_extend,_and_extinguish

Akorát chtějí rozes*at stabilní stav který je tu díky AMD a široké podpoře ve všech jejich procesorech.

+1
+6
-1
Je komentář přínosný?

- Intel AVX2-compiled applications, re-compiled to Intel AVX10, should realize performance gains

To je proto, že AVX2 nemá pokročilou funkcionalitu z AVX-512, jako mask registery a tak. AVX10 by takový 256bitový kód používající registry YMM povýšil na úroveň, kterou doteď bylo možné dosáhnout jenom s AVX-512 (které už samo má i možnost provádět jenom 256bitové operace na registrech YMM; v podstatě tohle samé by se dalo říct i o portování z AVX2 na AVX-512 při zachování 256bitových YMM instrukcí - jediné, co AVX10 mělo změnit, by bylo to, že procesor by tohle mohl poskytovat, aniž by měl plnotučné 512bitové registry ZMM)

- Existing Intel AVX-512 applications should see the same performance when compiled to Intel AVX10"

To je proto, že AVX-512 už všechny ty vylepšení měl k dispozici předtím, a teda se pro kód, který je už používal, nic nezmění.

TL;DR v tomhle není žádnej zlej záměr ani spiknutí. (Jediná zlomyslnost mohl být záměr zkusit odradit vývojáře aplikací od používání 512bitových operací, když je teď mělo AMD a přechod na 256bitové, které budou mít obě firmy, ale AMD bude platit za křemík navíc na nepoužívané 512bitové operace - jestli to byl opravdu záměr, tak to každopádně už Intel opustil tím, že 256bit-only AVX10 zrušil).

+1
+3
-1
Je komentář přínosný?

S těmi šachry u FP16 / BF16 to vypadá vyloženě na truc uražené mrchy.

+1
0
-1
Je komentář přínosný?

Nebude to fungovat, Intel to schválně předělal, aby to nebylo kompatibilní. Kdysi dávno by mu to dalo výhodu, za ten rok, než s tím vyrukuje, mu to může podrazit nohy.

+1
+3
-1
Je komentář přínosný?

Jestli jsem spravne pochopil clanek pana Olsana, tak se mylite: https://www.cnews.cz/clanky/jedna-z-hlavnich-nevyhod-malych-jader-zmizi-...

+1
+1
-1
Je komentář přínosný?

Jo bude to mít normální AVX512

+1
0
-1
Je komentář přínosný?

"AVX10.2 je v zásadě AVX-512 s trochu odlišně vyváženými požadavky, které měly evidentně dva cíle. Vyřešit (ne)podporu AVX-512 na PC procesorech a upravit specifikace tak, aby nevyhovovaly stávajícím procesorům AMD. Ty totiž nepodporují instrukce AVX512_FP16 (podporují AVX512_BF16, které jsou pro AI výhodnější), takže požadavek na jejich podporu je diskvalifikuje z kompatibility s AVX10."

+1
-3
-1
Je komentář přínosný?

Coz ale neznamena, ze program pouzivajici AVX10.2 instrukce, ktere AMD podporuje v ramci AVX512, nebude kompatibilni.
Popravde vubec netusim, co tim chcete rict. Ale jsem si celkem jisty, ze jste si tu puvodni informaci vycucal z prstu, aby vyhovovala vasi predstave o svete, a ted se to snazite nejak dolozit. Uz vas nejaky ten patek potkavam.

+1
0
-1
Je komentář přínosný?

Takhle ale binárky nefungují. Kontrolují flagy CPU a pokud příznak není tak volí jinou cestu.
Bude to pak peklo na kompilaci protože namísto strojového kódu
if (systém_umí_AVX512ABC) then makat()
bude
if (systém_umí_AVX10_1 OR systém_umí_AVX10_2 OR systém_umí_AVX512ABC) then makat()

Naprosto zbytečný. Už Linus říkal, že máme flagy na CPU a není potřeba vymýšlet zaobalovací věci typu x86_v3. AVX10 je přesně jen zaobalovák. Intel si myslí že kompilery pak budou kontrolovat jen AVX10, ale to je strašně naivní. Hlavně že je Intel ve spolku pro "podporu a rozvoj x86".
Prostě ať nejdřív implementuje co už je vymyšlený a pak se můžeme bavit dál, to je normální přístup.

+1
+4
-1
Je komentář přínosný?

https://en.wikipedia.org/wiki/Advanced_Vector_Extensions#AVX10

"The first version of AVX10, notated AVX10.1, does not introduce any instructions or encoding features beyond what is already in AVX-512 (specifically, in Intel Sapphire Rapids: AVX-512F, CD, VL, DQ, BW, IFMA, VBMI, VBMI2, BITALG, VNNI, GFNI, VPOPCNTDQ, VPCLMULQDQ, VAES, BF16, FP16). For CPUs supporting AVX10 and 512-bit vectors, all legacy AVX-512 feature flags will remain set to facilitate applications supporting AVX-512 to continue using AVX-512 instructions."

TAKZE: AVX10.1 = full AVX512 tak ako ho podporuje Saphire Raphids:
https://en.wikipedia.org/wiki/Advanced_Vector_Extensions#AVX-512_CPU_com...
(Saphire Raphids vs. Zen5 - je tam maly roozdiel na konci v FP16 a VP2INTERSECT, inak to iste)
Jedna sa teda iba o ciste bohapuste primitivne premenovanie

Co to bude AVX10.2. dnes netusi ani diva srnka v case ruje skrizena s besnym danielom. Ale mala by to byt nadmnpzina toho co podporuje Saphire Raphids.

+1
0
-1
Je komentář přínosný?

„Avx 512 je podmnožina instrukcí avx 10.2“

To by znamenalo, že AVX10.2 bude vyžadovat podporu všech AVX-512 instrukcí, což jistě nebude. Jaký by byl důvod implementovat instrukce AVX-512 ER, PF, 4FMAPS, 4VNNIW a VPOPCNTDQ, které vznikly na míru Larrabee a nic jiného je nepodporuje?

+1
0
-1
Je komentář přínosný?

AVX 512 bylo krapet víc variant.

+1
0
-1
Je komentář přínosný?

Ano, a právě proto nemůže být AVX-512 chápáno jako podmnožina AVX10.2.

+1
+3
-1
Je komentář přínosný?

A to zcela záměrně. Aby Intel měl něco nové a AMD bylo ze hry.

+1
+3
-1
Je komentář přínosný?

Víte, ono se klidně může stát, že se tím vyšoupne ze hry Intel. Jeho doba zdá se už minula a už neudává směr vývoje procesorů.

+1
+1
-1
Je komentář přínosný?

Bez změny zdrojaku a rekompilace by měly fungovat staré binarky nativně na CPU s podporou avx 10. Implementace těch zmíněných tři instrukcí je virtuální na jiné instrukce. Proto je tam zmíněná plná zpětná kompatibilita. Tak to alespoň zmiňují zdroje. Nově přidané instrukce v avx 10.2 pochopitelně podporu přidanou mít ve zdrojacich musí. Celý ten smysl je v tom sjednotit ten bordel co Intel s avx512 udělal.

https://www.techpowerup.com/339702/intel-brings-avx10-2-to-desktop-start...

+1
0
-1
Je komentář přínosný?

To je zaujimave, pretoze samo o sebe to nedava zmysel. Vynutenie podpory elementu, ktory nikto nepouziva, aby som mohol technologiu premenovat a povedat, ze ja nieco podporujem a konkurencia nie je v tejto faze dost zufale.

A to z viacerych dovodov:
- Intel si s AVX512 nasekal tolko nepriatelov, ze podla mna na tomto poli stratil autoritu. To, ze jeho podporu plosne z procesorov vyhodil bolo uz len poslednym klincom do rakvy.
- AVX10, ak mi nieco podstatne neuslo, nepredstavuje skokove kvalitativne ani vykonnostne zlepsenie. Je to inkrementalne zlepsenie radovo mozno v %, mozno 10tkach %.

Spomenutie Intelackej kniznice na neuronky tomu dava trocha vacsi zmysel.

Mozno si niekto spomenul na to, ako v Inteli v 90tkach poohybali trh svojou matematickou kniznicou, ktora sa neunuvala detegovat konkurencne procesory a hadzala ich vsetky do pytle "toto musi byt 486tka". Takze aj ked ste software, ktory taku kniznicu pouzival spustili na Durone s MMX, 3DNow! a SSE1, kniznica sa tvarila, ze procesor podporuje iba FPU. Aj to len preto, ze procesory bez FPU ta kniznica nepodporovala vobec.

Nie som si isty, ze take nieco sa podari Intelu znova zopakovat. Ci uz technicky, alebo pozornostou, alebo tym, ze ta ich kniznica ma nejake podstatne zastupenie na trhu.

+1
+12
-1
Je komentář přínosný?

Pro zákazníky to smysl nemá. Jediny smysl je pokus poškodit konkurenci a tudíž všechny. S tim ať jde Intel do .. už není hegemon trhu.
Pokus typu: nepodporujes AVX 10 jsi looser.. se muze rychle obrátit do do: nepodporuješ rozšířené AVX512 ? Go out!
Místo produktů jen vymýšlejí jak poškodit ostatní. V té firmě je slušně zazmrdovano slovy klasika 😀

+1
+8
-1
Je komentář přínosný?

Opomenul jste jednu maličkost ... věk patentů.
Postupně dobíhají lhůty na platnost patentů pro různá rozšíření instrukční sady x86.
Pokud Intel vydá AVX 10 (a zaplatí si u patentového úřadu), zazdí to na dalších 25 let.

+1
-3
-1
Je komentář přínosný?

Nemají Intel s AMD stále uzavřenou dohodu o vzájemné výměně patentů, takže pokud AMD něco doplní do AMD64 Intel to může ve svých budoucích generacích implementovat a zase naopak. Pokud se rozšíří ISA neprofituje se z toho v SW hned, ale typicky až dlouho potom kdy to mají implementováno v HW oba dva.

+1
+9
-1
Je komentář přínosný?

Ale ISA x86 není jen o Intel a AMD.
Poslední dobou už se začíná hlásit o své místo i emulace x86 na čemkoliv jiném.

A tam to problém je.

+1
0
-1
Je komentář přínosný?

Je to softwarová emulace, a tam už nemá Intel sílu se nesmyslně soudit.

+1
0
-1
Je komentář přínosný?

Tak chcípající Intel kolem sebe. A jak zaspal s AVX-512, tak se snaží, aby AMD bylo mimo specifikace AVX-10. Super, začínám si přát, aby ti šmejdi zkrachovali.

+1
+1
-1
Je komentář přínosný?

Zoufalství pokračuje.

+1
0
-1
Je komentář přínosný?

Tak aby sme si to urovnali.
Ak intel procesor vidi prvu AVX512 instrukciu tak ma penalizaciu 40 000 cyklov, kedy znizuje takty vsetkych jadier aby neuhorel. To je seriozny problem, lebo sa znizuje odozva programu.
AMD procesor ma penalizaciu tak 40 cyklov. Preto aj Ryzeny maju vacsiu spotrebu v klude, lebo sa napajaju aj AVX512 tranzistory. Kdezto Intel procesory ich nenapajaju a preto tak dlho trva prechod od oblasti vykonavania obycajnych instrukcii k AVX512.
Osobne som skusal v jednom velkom CAD softveri zapnut AVX2 a som narazil, lebo sa zistilo, ze este v roku 2022 Intel produkoval CPU, ktore nemali ani AVX kde to este AVX512. A tak sa to nespravilo, kvoli 10 % zakaznikom. Takze AVX512 je nieco exoticke, cielene na nejake to 1 % uzivatelskych programov.
Som rad ze AMD zamakalo a spravili normalnu implementaciu AVX512 na svojich CPU. Jedine kvoli nim sa teraz bude AVX512 davat aj do obycajneho softveru.
Intel chcel stale zarobit na AVX, davat podporu len do drahsich CPU. A skoncilo to tak, ze adoptovanie AVX je katastrofalne. Az teraz AMD mu uplne vypalilo rybnik v tomto smere.
Ohladom AVX10 ... uz samotne avx512 ma tolko instrukcii, ze je to masaker. Dokaze skoro vsetko. Implementacia takeho mnozstva instrukcii v CPU zabera dost kremika. Nevidim dovod na dalsie rozsirovanie na kadejake exoticke typy, ktore treba len intelu. Zase z toho chce Intel vybit nejake peniaze, ale zase dostane po hube. Uz nie je tym co udava trend.

+1
+5
-1
Je komentář přínosný?

Nechci kazit optimisticke vyhledy, ale AMD ma AVX512 v consumer procesorech od 2022 a po softwaru pro obycejne lidi ktery by to vyuzil ani vidu ani slechu.

Pokud to spravne chapu, tak AMD ma navic AVX512_BF16, ktere jsou specificky vytvorene a uzitecne jen a pouze pro AI (zmensena manstisa, zvetseny exponent). Kdo, sakra, pouziva nebo dokonce trenuje AI na CPU?

+1
-2
-1
Je komentář přínosný?

Nějaký software pro obyčejné lidi existuje, namátkou ffmpeg, Handbrake, Blender, OpenSSL...

+1
+2
-1
Je komentář přínosný?

ffmpeg beru i když se tam používá jen pro úzký okruh operací (rangedetect); není to tak, že by celé av1/h265=... byly přepsané (i tady byl před časem bombastický článek, že zrychlení je až 90x, ale to se týká té jedné funkce, celý workflow se zrychlí mnohem méně). Handbrake je GUI obálka nad ffmpeg. Zrychlení OpenSSL je na klientské straně irelevantní. A blender není pro obyč lidi :-)

+1
-1
-1
Je komentář přínosný?

Na jednom clusteru jsem jel lehčí věci (predikce vlastností molekuly pomocí NNP) s PyTorch na CPUčkách, neb i tak to bylo rozumně rychlé, bylo to jen pár výpočtů a cluster s AMD Instinctama jsme teprve rozbíhali. AI nejsou jen LLM, jsou tam i míň náročné specifické výpočty, kde CPUčka stačí a je tam snazší setup.

+1
0
-1
Je komentář přínosný?

Buďto mi záleží na výkonu a pak to udělám přes GPU, nebo mi nezáleží a pak propadu 25 % výkonu v AVX512 float32 oproti bfloat16 oželím. Stejně bych se vsadil, že ten pytorch avx512 nepoužil, natož bfloat16.

+1
-3
-1
Je komentář přínosný?

„Preto aj Ryzeny maju vacsiu spotrebu v klude, lebo sa napajaju aj AVX512 tranzistory.“

AMD má větší spotřebu v klidu hlavně kvůli tomu, že mezičipletová komunikace tak, jak ji má implementovanou AMD nyní, žere o něco více energie. A to je právě nejvíce viditelné v klidu. V Zen6 by měla být nová pokročilejší verze propojení mezi čiplety a tam už by to mělo být podstatně lepší.

+1
+2
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.