Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Lisa Su představila novinky pro servery a AI: XPU o 3+ roky dříve než Intel

Pat potrebuje nove spatna zrkadla

+1
+10
-1
Je komentář přínosný?

Pat už žiadne zrkadlo v serverovom segmente nepotrebuje, práve bolo to jeho zrkadlo rozmrvené na prach a každé ďalšie by dopadlo rovnako (márna snaha).

+1
0
-1
Je komentář přínosný?

Od Intelu by měl mít zaznít první výstřel s mobilním MeteorLakem toto září, ale opravdu se začně probouzet od Q4 2024 (ArrowLake). Nicméně potrvá minimálně celý rok 2025 než doženou AMD na poli serverů, protože tou dobou už tu budou Epycy generace Zen 5/5c a další XPU... AMD má dobře nakročeno udržet svoji pozici být silnou dvojkou na trhu.

+1
-4
-1
Je komentář přínosný?

"ale opravdu se začně probouzet od Q4 2024 (ArrowLake)"

nieco take podobne som uz pocul, ale mal to byt Alder Lake, potom ten refresh hentoho, potom to mal byt Meteor a teraz najnovsie Arrow. Uz maju tolko jazierok, ze sami nevedia, ktore ma byt ten turning point

+1
+6
-1
Je komentář přínosný?

Zadna dvojka ale AMD je uz jednotka na trhu, trzni podil nejsou technologie...!

+1
+2
-1
Je komentář přínosný?

Pat vymenil zpetny zrcatko za dalekohled..

+1
+4
-1
Je komentář přínosný?

ja ti neviem, mam pocit, ze pokukuje po hubblovom teleskope

+1
+4
-1
Je komentář přínosný?

Je to až úžasný, když člověk vidí suverenní výkony AMD v oblasti procesorů na každém segmentu, od noťasů po servery. Ještě do mobilů by mohli proniknout. ;-)

O to víc je ale vidět selhávání na poli grafik. I proto bude zajímavé sledovat Intel, protože třeba zvládnout obojí je na jednu firmu moc. Možná to bylo správně, když to bylo rozdělené na NVidia vs ATI a Intel vs AMD.

+1
-10
-1
Je komentář přínosný?

Spíš je úžasné sledovat, kam se dostala firma, která byla před několika lety na hranici životaschopnosti ... s cenou akcií pod 2 dolary ... Lisa Su a její tým předvedli neskutečný vzestup.

+1
+13
-1
Je komentář přínosný?

A zákazníci ďekují...!!!

+1
+2
-1
Je komentář přínosný?

>Je to až úžasný, když člověk vidí suverenní výkony AMD v oblasti procesorů na
>každém segmentu, od noťasů po servery. Ještě do mobilů by mohli proniknout. ;-)

>O to víc je ale vidět selhávání na poli grafik.

To je ale tým, že vývoj CPU je:

Primárny tým
Austin,Texas (robí CPU od roku 1995 a dnes robí primárne výkonné a server CPU)

Sekundárny tým:
Predmestia San José:Santa Clara/Sunnyvale, California (robí CPU o roku 1985, robí mobilné a server CPU)

Terciárny tým (robí len optimalizácie architektúr CPU)
Austin.Texas (stavajú ho od roku 2018)

Vývoj GPU sa robí
predmestie Toronta Merham, Ontario
a výpočtové GPGPU sa robnili tradične v San José,California

+1
+6
-1
Je komentář přínosný?

A hlave GPU je o SW podpore

CEO nVidia-e tvrdí, že pracuje na
HW : 20%
SW : 80%
času vývoja

v prípade CPU je to
85% HW
15% SW

a aj preto AMD angažovala Xilinx a Pensando, ktorých produkty

05-10% HW
90-95% SW podpora

a aj preto tak včera prezentovali SW podporu.

+1
+2
-1
Je komentář přínosný?

Nemyslim si ze GPU od AMD je selhani. nVidii se letosni generace hodne povedla a AMD se moc nepovedla, i kdyz to je otazka, vzhledem k tomu, ze je to uplne novy koncept (chiplety). Spis bych rekl, ze uskodily predbezne informace o vykonech 150%+, 3GHz, ale take o spotrebe 600W, ktera se nastesti nepotvrdila (take je dost mozne ze Navi 31 umi boostovat, pres 3GHz, ale pri spotrebe 500W+ a vykonu mensim nez ma 4090)

+1
+4
-1
Je komentář přínosný?

Ano, ocakavanie boli nerealne velke a vrcholovy model RDNA3: 2,3-2,5-2,7 ci dokonca 3x nasobok (+200%) nad vrcholovym modelom RDNA2 cili RX 6950 XT.

2x by bol este dost uspech, ale par desiatok % neni ruzove.

+1
0
-1
Je komentář přínosný?

Je to tak. S Navi31 mají na trhu funkční řešení. S druhou generací to odladí a nVidia bude jen čumět. Stejně jako teď u Intelu musí po této prezentaci čumět, jaké má AMD skvělé portfolio produktů pro servery (CPU na bázi Zen 4 / 4c, XPU pro AI apod.).

+1
+5
-1
Je komentář přínosný?

NVidii se náramně povedla generace Pascal! Od té doby to žádné zázraky nejsou, ani Turing, ani Ampére a ani Lovelace. Nicméně i tak dokáže nějaký ten pokrok zajistit. Vem si třeba Ampéru, zde dokázala AMD udržet krok jen díky nenažranosti NVidie, že do svých grafik dala málo paměti. V současné generaci omezuje grafiky úzká sběrnice a i tak AMD zase nic. :-/

Ale jak říkám, třeba to nejde, třeba je to ten důvod, proč to nejde ani Intelu. Třeba prostě ten prioritní procesorový tým bere jak u Intelu, tak u AMD zdroje, které chybí pro sekundární tým grafik. A pro NVidii je tým grafik primární, takže ten problém nemá. Nakonec konec mých spekulací, to poznáme, pokud ani Intel nic, ani AMD nic ani do budoucna. :-/

+1
0
-1
Je komentář přínosný?

Generace Ampere mela velke problemy s RDNA2. Proto 4080 musela byt na nejvetsim jadre, protoze by ji jinak AMD zadupalo do zeme. A vrcholove modely jak AMD tak nVidie byli nastejno, jen nVidia mela vetsi spotrebu. Prave Lovelace vyrazne zlepsila efektivitu a podle me kdyby rady a cenu neposoupli o stupen vys, tak by to byla asi jedna z lepsich architektur. Bohuzel kdyz Kozena bunda videl, ze lidi jsou schopny dat za RTX3060 30t. tak dalsi generaci napalil presne v tomhle smeru. Ale tak nejak mu nedoslo, ze ti co to chteli si to koupili a ti ostatni mu to nekoupili tehdy ani ted. Na to ze pro AMD je to bokovka tak nVidii velmi dobre zatapi.

+1
+3
-1
Je komentář přínosný?

Pre AMD to určite bokovka nie je. Len s ohľadom na ich budget im tie zvyšné investície donedávna nestačili. Teraz AMD však chystá aj v laptopoch ofenzívu a ja si osobne myslím, že RDNA4 tým, že bude do veľkej miery fixnutá a doladená RDNA3 má potenciál poriadne zakúriť. RDNA3 z RDNA2 bol asi príliš veľký krok dopredu, ale tak pokiaľ chceli dobehnúť Nvidiu museli aj trošku riskovať.

+1
+1
-1
Je komentář přínosný?

Výsledek Navi 3x bych vůbec nespojoval s čiplety. Čipletové řešení se povedlo, problém je jinde. Kdyby byl problém v čipletech, netýkal by se Navi 33.

+1
+2
-1
Je komentář přínosný?

Zni to logicky, ale nemusi to byt nutne pravda. Struktura a zpusob fungovani obvodu na vypocetnim cipletu mohly byt upraveny, aby byly schopny komunikovat a pracovat s pestrejsimi konfiguracemi pameti. A to ze jsou radicce pameti v monolitu a ne v samostatnem cipletu nemusi mit vliv.

+1
0
-1
Je komentář přínosný?

K ZEN 4c .. nikde nepadla informace. (Nebo jsem přehlédl.)
Jak jsou na tom latence mezi jádry?
Což je hlavní slabina řešení od intelu.
Když je víc jader, tak budou latence horší. Ale o kolik?
Jaký dopad na výkon to má?
A budou latence horší i v lehkém MT (do 64 threadů)?
Samozřejmě cloud latence mezi jádry neřeší. Když má každá instance vlastní jádro.
AMD Bergamo prezentuje jako cloudové řešení. Takže nadšený sice jsem, ale jen opatrně.
Už jen to že snížili počet chipletů svědčí o tom, že to není úplně jednoduché, prostě přidávat jádra.

+1
0
-1
Je komentář přínosný?

Mezi jádry v rámci CCX jsou stejné jako u Zen 4 a mezi CCX jsou stejné jako mezi čiplety u Zen 4.

+1
+4
-1
Je komentář přínosný?

Podle dostupných informací byl Zen4c vytvořen pro jinou oblast aplikací než Zen4. Z pohledu využití v aplikacích je asi nejdůležitějším rozdílem velikost a organizace vyrovnávací paměti nejvyšší úrovně = L3 cache.

Klasický Zen4 má 32MB L3 společné pro všech 8 jader běžících na o něco vyšších pracovních frekvencích. Společný přístup jader k větší L3 je výhodné pro výpočetně náročné aplikace, kde jádra spolupracují na iterativním zpracování velkých společných dat sdílených přes velkou L3 vyrovnávací paměť. Tedy třeba zpracování fyzikálních simulací založených na interakcích mezi body v rozsáhlé, husté síti souřadnic.

Procesory se Zen4c jsou určeny pro zpracování množství vzájemně nezávislých, výpočetně méně náročných úloh, jako je třeba obsluha klientů webových a databázových serverů, nebo datových úložišť. Díky menší výpočetní zátěži stačí jádrům nižší frekvence. Protože jádra data vzájemně nesdílejí a jejich zpracování není opakované stačí jim i menší L3 vyrovnávací paměť. A pokud operační systém zbytečně nepřehazuje úlohu mezi jádry, nebo dokonce mezi bloky jader (CCX) není moc kritické ani zpoždění při předávání úloh a dat mezi jádry. A tedy ani rozdělení L3 na dvě části.

Ani to rozdělení jader na dva bloky (CCX) ale není samoúčelné. Jádra se společnou L3 vyrovnávací pamětí a zbytkem procesoru komunikují prostřednictvím společné vnitřní kruhové sběrnice (ring bus) CCX bloku a pokud jich na sběrnici visí příliš mnoho, dochází k brždění dat čekáním na uvolnění sběrnice využívané jinými konkurenčním jádry. Rozdělení na dva CCX bloky tedy zvýší propustnost vnitřní sběrnice dostupné každému jádru na dvojnásobek a zmenšení L3 vyrovnávací paměti (cache) sníží zpoždění přístupu (latency) k datům v ní. Pro úlohy, pro které je Zen4c optimalizován bude tedy nejen celkový výkon, ale i výkon na jádro téměř jistě vyšší, než kdyby bylo 16 jader v jednom CCX bloku s 32MB společné L3.

+1
+3
-1
Je komentář přínosný?

Jen taková drobnost ... není to Ring Bus.

U 4 core CCX bylo propojení jader každé s každým (Zen, Zen+, Zen2)
U 8 core CCX už to nebylo každé s každým, ale ne dál než přes jedno jiné jádro (Zen3)
Nedávno AMD přeedstavilo trochu jiný způsob propojení jader (Řebřík)

Ring Bus jako takový používá Intel u čipů do 10 jader (u více jader používá mesh). Vyšší počet "bodů připojení" na Ring Bus už dělá problémy. Proto taky nepřipojuje E-cores na Ring Bus přímo (jednotlivě), ale jako čtveřici.

+1
+1
-1
Je komentář přínosný?

No nejsem si jistý, protože o vnitřní struktuře čipů moc oficiálních informací není, ale při spojení jader a L3 uvnitř CCX systémem každý s každým, by pro samé dráty na čipu asi už moc místa nezbylo. Pro jistotu jsem zkusil něco rychle dohledat a dole uvedený zdroj říká, že používají obousměrnou kruhovou sběrnici:

"AMD used a bi-directional ring-bus with the Zen 3 CCDs, allowing the transfer of up to 32 bytes of data per cycle, further boosting the bandwidth and reducing latency."

https://www.hardwaretimes.com/amd-ccd-and-ccx-in-ryzen-processors-explai...

+1
+3
-1
Je komentář přínosný?

Tohle je staré.
Nedávno (květen 2023) proběhla (i českými) weby novější informace.
Každé jádro v Zen3 by mělo mít přímé propojení na 4 další jádra. (Rind bus jenom 2)

+1
0
-1
Je komentář přínosný?

„Mezi jádry v rámci CCX jsou stejné jako u Zen 4“
Tak to je jasné. CCX se změnil jen jednou. S příchodem ZEN3.

„mezi CCX jsou stejné jako mezi čiplety u Zen 4.“
Tak toto je trochu nejasné.
I ty nejvzdálenější chiplety budou mít stejnou latenci jako dva CCX v rámci jednoho chipletu?

+1
0
-1
Je komentář přínosný?

Počet jader snížili, protože jsou o něco větší a nevlezla by do pouzdra - ale u další generace to srovnají a tam přijde ten nášup jader.

+1
0
-1
Je komentář přínosný?

Do pouzdra by se jim vešlo 12 P-Cores.

Ovšem za předpokladu, že vyhodí E-cores a iGPU.

+1
0
-1
Je komentář přínosný?

V těch současných jsou jen chiplety s většími nebo menšími jádry a centrální chiplet. A v serverovém centrálním žádné GPU není. Jen ty procesorové jsou trochu širší a proto jich tam vejde jen 8.

+1
0
-1
Je komentář přínosný?

"..V těch současných .."
Současnými myslíte desktopové 13xxx ?

BTW ... měl jsm dojem, že se bavíme o desktop CPU. Ty se pozdří. Na ntb CPU se nedává heatsink (a mají jiný rozměr).

+1
0
-1
Je komentář přínosný?

Žádný desktop AMD CPU s ZEN 4c neexistuje, takže to je hodně teoretická úvaha. A pouzdření neznamená jen uzavření krytem, ale i propojení na substrátu. Navíc jsem reagoval právě na základě toho, jak vypadá ZEN 4c EPYC.

+1
0
-1
Je komentář přínosný?

Vypnute SMT asi ani tak nebude kvoli dopadu na vykon susedneho threadu. Na to tak nejako sere pes. Ale skor kvoli moznej exfiltracii dat postrannymi kanalmi v style Spectre a Meltdown. Niektore tie techniky su bud mozne iba na SMT systemoch, lebo tam maju vyrazne vyssiu uspesnost.

+1
0
-1
Je komentář přínosný?

a resi se to zrovna jenom v cloudu, jo?? sorry, ale to je fakt blbost.. (:

+1
-2
-1
Je komentář přínosný?

Bavíme se o CPU která jsou od základu postavená pro specifický trh. Dalo by se říct skoro na míru pro jednotlivé klienty. Tomu odpovídá i cena.
A mezi těmito giganty (Amazon, Google, M$,...) se jich pár najde se specifickým požadavkem:
"Nechceme SMT stejně by jsme ho vypnuli."
A pro ně je toto CPU bez SMT určené.

+1
+1
-1
Je komentář přínosný?

Ťažko povedať. Pri cene 10 200 USD bez DPH/kus pri odbere v tisícoch kusov musí mať absencia SMT dôvod, a asi má pravdu redaktor, lebo VDI a Media Streaming budú bez SMT plynulejšie ale pri tímové (colaborative) riešeniach weboch absencia SMT zvýši bezpečnosť.

AMD EPYC™ 9754S
General Specifications

# of CPU Cores
128
# of Threads
128

1kU Pricing :10,200 USD

Workload Affinity:
App dev/test
Collaborative
Consumer-Oriented Digital Services
Content mgmt
General Purpose
HPC
Media streaming
VDI
VM Density
Web Serving
https://www.amd.com/en/product/13381

Aj keď za 128 C 256T si skoro nepriplatíte
AMD EPYC™ 9754

# of CPU Cores
128
# of Threads
256

1kU Pricing 11,900 USD
https://www.amd.com/en/product/13371

rozhodne menej ako za V-cache
AMD EPYC™ 9684X

# of CPU Cores
96
# of Threads
192

L3 Cache 1152MB
1kU Pricing 14,756 USD
https://www.amd.com/en/product/13511

resp. na porovnanie je zoznam CPU
https://www.amd.com/en/processors/epyc-9004-series

To už sú cenovky ako od Intelu
Intel ruší Xeony s podporou nízké kapacity RAM a až o 50 % zlevňuje zbylé modely
20. 1. 2020
U vyšších modelů s 28jádry jde tedy o bezmála třetinový pokles ceny, u modelů s nižším počtem jader šla dolů ještě výrazněji, zhruba na polovinu:

Xeon Platinum 8280L (28j): $17 906 -> $13 012
Xeon Platinum 8276L (28j): $16 616 -> $11 722
Xeon Platinum 8260L (24j): $12 599 -> $7705
https://diit.cz/clanek/intel-rusi-xeony-s-podporou-nizke-kapacity-ram-az...

všetko za kus bez DPH pri odbere v tisícoch kusov

+1
+2
-1
Je komentář přínosný?

Je čas oprášit starou revoluční myšlenku: kdyby Intel koupil Nvidii a nechal si šéfovat Jen-Hsunem, tohle by dnes nebylo.

+1
-2
-1
Je komentář přínosný?

To už raz bolo a padlo to na Hoángovom egu

AMD Talked With Nvidia About Acquisition Before Grabbing ATI
Feb 22, 2012
using CPUs and GPUs would let AMD hit the PC market with something Intel wasn’t ready to offer.

AMD’s first target: Nvidia. But Nvidia Chief Executive Jen-Hsun Huang (see our January 7, 2008 cover story on Nvidia "Shoot to Kill") insisted on being chief executive of the combined company, according to a former AMD employee (Nvidia declined to comment for this story).
https://www.forbes.com/sites/briancaulfield/2012/02/22/amd-talked-with-n...
https://hexus.net/business/news/corporate/35705-amd-wanted-buy-nvidia-at...

+1
+1
-1
Je komentář přínosný?

Právě proto píše, že měl Huang šéfovat.

+1
0
-1
Je komentář přínosný?

Akurát to bude neprijateľné pre vlastníkov Intelu

+1
0
-1
Je komentář přínosný?

Tak oprášit to klidně můžeme, jenom to máš trochu popletené. Teď je na pořadu dne, že si Nvidia koupí Intel.

+1
0
-1
Je komentář přínosný?

Nevím, jestli se to právně nezměnilo, ale tradovalo se, že x86 licence je nepřenosná a i když někdo koupí firmu vlastnící x86 licenci, samotnou licenci nezíská.

+1
+1
-1
Je komentář přínosný?

Tak ale tuhle podmínku si stanovil Intel, když pod tlakem IBM dal x86 licenci AMD. Že by podmínil sám sebe při koupi někým jiným o tom teda nevím. Problém by mohlo dělat AMD s x86-64, ale to je asi spíš technikálie pro kravaťáky.

+1
0
-1
Je komentář přínosný?

Tomu říkám pokrok, koněčně pořádné čtení!

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.