Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k IPC Zen 4, Zen 5 a podoba Zen 4c/D: 2× větší L2 cache, až 4× menší L3 cache

o 25 % vyšší IPC (podobně jako Zen 4 oproti Zen 5)
Předpokládám, že tam mělo být:
o 25 % vyšší IPC (podobně jako Zen 4 oproti Zen 3)

+1
+1
-1
Je komentář přínosný?

Díky, opraveno.

+1
0
-1
Je komentář přínosný?

Nahodou za mesiac nema biť uvedeni na trh ZEN3+3D?
Nieje trochu priskoro rozoberať CPU čo ma vyjsť v 2023 a porovnavať jeho vykon s CPU čo asi dorazi v 2025?

+1
-1
-1
Je komentář přínosný?

A to mě tady minule někdo přesvědčoval, že všechny další Zeny budou mít V-cache automaticky.
Fascinuje mě, jak se ještě nevzdali zvyšování frekvencí, protože i ty současné jsou u x86-64 přestřelené a již dávno měla přijít stagnace.

+1
+2
-1
Je komentář přínosný?

Formuloval bych to asi tak, že „všechny“ nejspíš budou V-cache podporovat, ale na její nasazení dojde v desktopu asi jen u refreshů nebo speciálních modelů, budou-li potřeba. Primárně se asi uživí v serverech.

+1
+4
-1
Je komentář přínosný?

Bol som to ja. Tak hovorili leaky, no asi to nemusí byť pravda.

+1
+1
-1
Je komentář přínosný?

Ja bych rekl, ze jista logika v tom je.

V-cache dava prakticky generacni rozdil. Rekneme ze vydaji Zen3+Vcache - AMD reklo ze vykon stoupne o 15% prumerne. Pak vydaji Zen4 **bez** Vcache - prumerne o 25% nad Zen3... to by znamena jen 10% nad Zen3+Vcache. To by bylo docela slabe na to, ze jde o uplne novou platformu....

Jinak receno, jakmile jednou uvedou nejaky model s V-cache, jakykoliv dalsi model (v podobnem segmentu trhu), ktery ji **nebude** mit, ma automaticky minus 15% vykonu. (dobre, mozna ne presne 15, ale docela netrivialni %) Jedina situace kde by se to hodilo, je segmentace trhu - ze by treba v mainstreamu meli modely s i bez Vcache. Ale jakmile uvedou 5900X / 5950X s V-cache, existuje nejaky dobry duvod proc by hiend dalsi generace nemel mit Vcache ?

.. a specialne u Zen4 by to nedavalo smysl, clovek bude stejne platit nove DDR5, novou fosnu, i kdyby ta Vcache stala 100$ navic tak se to v celkove cene ztrati.

+1
-1
-1
Je komentář přínosný?

Celé to záleží na ceně. Existují i výrobky pod 8000 Kč a snad budou existovat i s 5nm Zen4.
„Pak vydaji Zen4 **bez** Vcache - prumerne o 25% nad Zen3... to by znamena jen 10% nad Zen3+Vcache. To by bylo docela slabe na to, ze jde o uplne novou platformu...."

Pokud to bude čtyřjádrový až šestijádrový lowend/nižší mainstream, tak to bude dost dobrý výsledek.

„existuje nejaky dobry duvod proc by hiend dalsi generace nemel mit Vcache ?"

Ano, cena. Ne pro každého bude v-cache natolik přínosná, aby si za ni připlatil na úkor jader a pokud dnes stojí 64 jader přes 100 tisíc, tak kolik by to stálo s v-cache na 5nm? DDR5 budou za pár měsíců cenově níže.

+1
+1
-1
Je komentář přínosný?

„AMD reklo ze vykon stoupne o 15% prumerne.“

14 % v průměru z několika vybraných her. Jiné než herní výsledky z Ryzen V-cache zveřejněné nebyly.

+1
+1
-1
Je komentář přínosný?

iné výsledky boli zverejnené so serverovými Epyc, o čom ste písali článok, ktorý vyšiel pred 36 dňami, Je úplne evidentné, že Epyc na Zen4 bez V cache nebude možný..

AMD uvedla Milan-X s V-cache, Instinct MI200 (až 5× Ampere) a ohlásila Zen 4c
9. 11. 2021 | no-X

AMD uvádí, že u cílového softwaru lze pozorovat výkonnostní rozdíl oproti Epycům Milan i přes 50 %, což doložila testem srovnávajícím výkon Milan a Milan-X v Synopsys VCS používaném pro verifikaci návrhů čipů. Za jednotku času zpracoval Milan 24,4 úloh, zatímco Milan-X 40,6 úlohy, čímž dosáhl o 66 % vyššího výkonu.

Podle testů Microsoftu, v jehož Azure HBv3 již Milan-X běží, dosahuje o 80 % vyššího výkonu v leteckých simulacích a o 50 % vyššího výkon v automobilových crash-testech.
https://diit.cz/clanek/amd-uvedla-milan-x-s-v-cache-instinct-mi200-az-5x...

+1
0
-1
Je komentář přínosný?

Ano, ale serverové aplikace mnoho uživatelů desktopu nezajímají a jsou od typické desktopové aplikační zátěže ještě víc odtržené než hry. Typická komprese videa, zvuku ap. většinou neprofituje z větší cache, protože jde o algoritmy optimalizované na kapacitu cache běžných procesorů (kvůli tomu, aby se data vešla do malé cache, vznikly typy komprese pracující s bloky).

+1
+2
-1
Je komentář přínosný?

Ty algoritmy jsou optimalizované na menší cache, protože doteď měly CPU menší cache. Není v tom žádná věda. Autoři kód aktualizují, stejně jako rychle přišla podpora pro M1, kde je změn mnohem víc. Jinak běžný uživatel desktopu na uváděné příklady kódování videa a zvuku použije specializovaný obvod.

+1
0
-1
Je komentář přínosný?

Běžnému uživateli desktopu dnes stačí na jeho brouzdání internetem a lajkování na Facebooku napařovací žehlička, takže tento segment jsem úplně na mysli neměl. Osobně si moc neumím představit, že by existence procesoru s velkou cache mohla změnit velikost bloku videokodeků, protože to je součást jejich specifikace, na kterou jsou postavené (mj. hardwarové) dekodéry. Tím se ale dostáváme od situace, na kterou jsem chtěl poukázat - bude řada aplikací, ve kterých se V-cache nijak zásadně neprojeví. A dále i úlohy, které by měly prostor pro optimalizace pro větší cache, se na přijetí Zen 3 s V-cache moc neprojeví, protože výkon v grafech recenzí je nebude reflektovat a až (pokud) takové optimalizace ve větší míře přijdou, bude to v době, kdy už na trhu bude Zen 4 a kdy to už většinu zákazníků nebude příliš zajímat.

+1
+1
-1
Je komentář přínosný?

Furt se to projeví ve více aplikacích, než např nekonečný příběh AVX-512 (které je a není - spousta ani nových procesorů, včetně těch od Intelu, ho nemá a spousta jich ho má jen emulovaný přes dvě AVX2 jednotky).

+1
0
-1
Je komentář přínosný?

Proti tomu nic nemám.

+1
0
-1
Je komentář přínosný?

Vrtalo mi hlavou, jak se ve vyšších programovacích jazycích optimalizuje pro velikost cache. Jestli jde o přizpůsobení se velikostí pracovního datového bloku, tak mi to konečně dává smysl :-)

+1
0
-1
Je komentář přínosný?

Třebaže vyšší jazyky jsou jazyky strojově nezávislé, to ještě neznamená, že nemohou detekovat typ počítače, na kterém běží, a přizpůsobit tomu nějaké konfigurační parametry procesu.

+1
0
-1
Je komentář přínosný?

To ano. Já spíš myslel něco ve smyslu řízení, co do cache má přijít a co tam přijít nemá ... Přizpůsobit algoritmus na základě detekce hardware mi připadá jako elegantní, ale znouzecnost. Otázkou je, zda je to možné vůbec ovlivnit - jinak než přes cache se do procesoru data nedostanou ...

+1
0
-1
Je komentář přínosný?

No jak.....větší cache znamená více úspěšných hitů nez se musí jít do velké RAM s větší latenci. Takže se dá optimalizovat tak, že se víc věcí odloží do RAM - pracuje se s větším balíkem dát, který by jinak znamenal už moc málo úspěšných hitů do cache a moc velké zvýšení latence. Nic jiného v tom není. Je to pořád to samé už 30 let. Pamatuji se, jak jsem si přidával do patic na desce SRAM k nějaké 486 a prakticky si tak vytvářel l2/l3 cache (teď fakt nevím, jestli to byla l2 nebo l3). To samé je u gpu infinity cache. Atd....

+1
0
-1
Je komentář přínosný?

14 nebo 15 je celkem sumafuk. rozptyl byl tusim od 1.04 do 1.25, je celkem jasne ze tam bude hodne velky rozptyl, a taky je jasne ze programy ktere se vejdou do L1/2 z toho profitovat nebudou.

Porad to neodpovida na muj dotaz: proc by AMD do nove generace nedavala Vcache (alespon do hi-endu). Cena ? teoreticky, ale 5950X uz ted neni levnej.

+1
0
-1
Je komentář přínosný?

„jen 10% nad Zen3+Vcache. To by bylo docela slabe na to, ze jde o uplne novou platformu“

Není to zase tak dávno, kdy 10 % byl docela fajn mezigenerační posun :-)

+1
+4
-1
Je komentář přínosný?

U některých firem i 3%...

+1
+4
-1
Je komentář přínosný?

Podle mě budou mít u Zen 4 V-cache X verze procesorů od 8-jader výš, přičemž cenový rozdíl proti procesorům bez X bude vyšší než dnes.

+1
0
-1
Je komentář přínosný?

No vy jste absolutne nekriticky siril pekne kraviny.

O nasobnem vykonu Zen5 proti Zen3, atp. A nejhorsi je, ze jste jako trubka pouzival pseudoargument, ze se povedlo u Zen1 dostat vetsi IPC oproti Bulldozeru nez bylo puvodne planovane (coz nikdo s inteligenci vyssi nez kbelik blata nemohl brat jako rozumny argument proc by Zen 5 mel byt taaaak hrozne vykonny).

+1
+1
-1
Je komentář přínosný?

>O nasobnem vykonu Zen5 proti Zen3

O tom som nehovoril

1,25*1,4=1,75 x tedfa o 75% nárastu výkonu Zen5 oproti Zen3, a dával som zdroj.

>(coz nikdo s inteligenci vyssi nez kbelik blata nemohl brat jako rozumny argument
>proc by Zen 5 mel byt taaaak hrozne vykonny).

Prečo by mal byť tak výkonný. Aby AMD udržala presun marketshare k sebe.
Logiku to má ak sa využije, zatiaľ - už iba v Číne-neschválená, akvizícia Xilinx-u.
Prvý produkt, ktorý môže vyťažiť z akvizície Xilinx-u AMD, má vyjsť na trh 18 mesiacov po skončení akvizície, teda nie skôr ako v mesiaci jún/červen 2023.

Sú zásadné pochybnosti o tej akvizícii to môžu oddialiť, že sa nestihnú dodať do Zen5. Môj zdroj ale počítal s tým, že ten nárast bude aj vďaka synergii AMD-Xilinx. A tá nemusí byť pri Zen5

+1
+1
-1
Je komentář přínosný?

Vy jste ocekaval, ze Zen 4 bude o 40-50% vice nez Zen 3 a ze Zen 5 bude mit dalsich 40-50% nad Zen 4.

Nekolikrat jsem vam rikal, ze by nebylo v AMD zajmu produkovat monstrozni (40-50%) skoky s generaci. Ze uz tedka prodava co vyrobi a velmi dobre, ze jim stoupaji marze, nemaji tedy absolutne zadny duvod produkovat neco takoveho. Market share jim stoupat moc nemuze, kdyz nemuzou zvysovat vyrazne vyrobu... Na Intel bude stacit ~25%.

Akvizice Xilinxu je zase uplne neco jineho. A absolutne nesouvisi s tim, jestli Zen 4 bude 25, nebo 30, nebo 40% vykonejsi nez Zen3.

Xilinx neceka na Zen5. Xilinx ma co prodavat a bude mit co prodavat i nasledujici mesice. I kdyby prodavali housky a ty nakupovali v Izraeli u fabriky Intelu, tak bude AMD z toho mit baksis.

Xilinx nezvysi market share v desktopech AMDcku. Xilinx se specializuje na FPGA. Uplne jiny market. Akvizice bude pro AMD samozrejme super, bude mit vetsi portfolio, takze pokud by v nejake oblasti zakopla, nebude to pro ni tak kriticke.

+1
0
-1
Je komentář přínosný?

>Vy jste ocekaval, ze Zen 4 bude o 40-50% vice nez Zen 3 a ze Zen 5 bude mit dalsich
>40-50% nad Zen 4.

Toto som nikdy netvrdil

spájate si dva rôzne leaky, písal som o oboch ale nespájal som ich

1. Zen4 vs Zen3 25% a Zen5 vs Zen4 40%
2. Zen4 vs Zen3 40% a Zen5 vs Zen4 20%

+40% a + 40% som nikdy netvrdil.

Jediné, čo som dodal, bolo, že Zen vs Bullodzer AMD plánovalo +40% a bolo to 52%

+1
0
-1
Je komentář přínosný?

>Xilinx nezvysi market share v desktopech AMDcku.

Ale AMD potrebuje zvýšiť podiel na serverovom trhu

Edit:
A bavíme sa tu o obnovenom projekte AMD Magnum
https://diit.cz/sites/default/files/amd_fpga_hbm.png

AMD se pustila do vlastního FPGA, představí ho ještě letos
10. 10. 2016
https://diit.cz/clanek/amd-magnum-fpga

TSMC Teases 12-High 3D Stacked Silicon: SoIC Goes Extreme
by Dr. Ian Cutress on August 25, 2020
https://www.anandtech.com/show/16026/tsmc-teases-12-high-3d-stacked-silicon

Quad-Layer 3D Wafer Stacking Technology Enables Chips of the Future
published July 20, 2021
https://www.tomshardware.com/news/quad-layer-3d-stacking-technology-enab...

+1
+1
-1
Je komentář přínosný?

"IPC + takty dohromady" - Intel ešte dokáže u ďalšej rodiny CPU navýšiť frekvenciu? Z 5 GHz na koľko to ešte môže ísť?

+1
-1
-1
Je komentář přínosný?

U Alder Lake šel s jednojádrovým boostem o 100 MHz dolů a zvedl jen vícejádrový boost. Dá se čekat, že u Raptor Lake opět jednojádrový boost zvýší z 5,2 na 5,3 GHz nebo 5,4 GHz (to by samo dalo 2-4 % výkonu).

+1
+1
-1
Je komentář přínosný?

Ja som narážal na všejadrový boost (min. tých veľkých).

+1
-1
-1
Je komentář přínosný?

Myslím, že u vícejádrového výkonu takty moc zvyšovat nemusí, od toho tam bude dvojnásobek Atomů.

+1
+2
-1
Je komentář přínosný?

Ucelem meho nasledujiciho prispevku neni rypat do neci prace - te si vazim a povazuji ji za profesionalni, ale do statusu quo co se tyce testovani (napric ruznymi weby, vetne zahranicnich). Celkem se to zacina zvrhavat.

Uz zacinam i rozlisovat vykon mezi 1 jadrem a 1 vlaknem (1 jadro muze, ale nemusi mit 2 vlakna a zalezi, kolik threadu dany test tedy vyziva).
Na multi thread testovani se dnes casto pouziva Cinebench. Pekne, ale to je extremni pripad, ktery dobre skaluje multithread.

V realu by mne zajimal test na definovany pocet vlaken (8, 16 nebo cokoliv zvoleneho), ktery by ukazal dane procesory ve vice realnych situacich.

Kolik lidi dnes pouziva prehistoricke 1-vlaknove programy a kolik lidi v realu pracuje s Cinebench? Tyhle testy nepovazuji za reprezentativni.

Kdyz dojde na vykon, tak se nakonec stejne podivam jen na hry (chapu, ze jini to mohou mit jinak), protoze ty jsou pro mne (subjektivne) jedine vyzadujici maximalni vykon. Vse ostatni je mi fuk. RAR bezi na pozadi, CGI negeneruju, bitcoiny netezim. Excel je cajk s vypoctem jak 1ms, tak i 2ms.

+1
+1
-1
Je komentář přínosný?

Asi ten Excel (nebo jakýkoliv jiný tabulkový kalkulátor) moc neyatěžujete.

BTW ... jednovláknový výkon ... všelijaké ty DRM (== Digital Restriction Management) a Anti-Cheat nesmysle jsou (minimálně při iniciaci) 1T by design.

+1
0
-1
Je komentář přínosný?

Prave....

S tim DRM chapu, ale v ten okamzik tam bezi dalsi vlakna samotne hry, takze to v realu samo o sobe stejne neni 1T. ale treba 10T.

+1
0
-1
Je komentář přínosný?

"Kdyz dojde na vykon, tak se nakonec stejne podivam jen na hry (chapu, ze jini to mohou mit jinak), protoze ty jsou pro mne (subjektivne) jedine vyzadujici maximalni vykon. Vse ostatni je mi fuk." - pokud koukáte na cokoliv vyššího než 1080p na low, tak to musí být pro vás recenze procesorů tak od Zen2 dost nuda...

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.