Lisa Su představila novinky pro servery a AI: XPU o 3+ roky dříve než Intel
Epyc Bergamo
Oficiálně byl představen Epyc Bergamo, který AMD již dodává vybraným zákazníkům. Tomuto procesoru jsme se již podrobně věnovali, takže jen stručná rekapitulace: Cloudové systémy, až 128 jader Zen 4c:
Ta jsou díky optimalizacím a přepracované implementaci podstatně menší než Zen 4, takže se jich na podobně velký čiplet vejde dvojnásobek a to bez dopadu na výbavu a softwarovou kompatibilitu.
Padla informace, že Zen 4c nese rychlejší L3 cache než Zen 4, čímž je patrně zčásti kompenzována její nižší kapacita.
Epyc | jád. / vl. | základ / boost všejádrový / jednojádr. | L3 cache | TDP |
---|---|---|---|---|
9754 | 128 / 256 | 2,25 / 3,1 / 3,1 GHz | 256 MB | 360W |
9754S | 128 / 128 | 2,25 / ? / 3,1 GHz | 256 MB | 360W |
9734 | 112 / 224 | 2,2 / 3,0 / 3,0 GHz | 256 MB | 320W |
Byly vydány 3 modely Epycu Bergamo, Epyc 9754 se 128 jádry a 256 vlákny, což je top model. Dále Epyc 9754S, který rovněž disponuje 128 jádry, ale má neaktivní SMT, jinými slovy nabízí 128 vláken. Ten může mít uplatnění u cloudových zátěží obzvlášť citlivých na sdílené hardwarové prostředky, kdy jedna úloha může negativně ovlivňovat výkon při zpracování jiné úlohy (SMT je de facto sdílením jednoho fyzického jádra mezi dvě vlákna / úlohy). Třetím modelem je Epyc 9734 se 112 aktivními jádry / 224 vlákny. Snadno spočítáme, že této konfigurace lze dosáhnout osazení 8 čipletů s aktivními 14 jádry (ze 16), případně 7 čipletů se všemi 16 aktivními jádry. V tomto případě půjde o první konfiguraci, neboť specifikace uvádění 256MB L3 cache, které lze dosáhnout jen osazením všech 8 čipletů.
Bergamo dosahuje podle testů AMD 1,6-2,6× vyššího cloudového výkonu než nejvýkonnější Xeony Intelu.
Epyc Genoa-X
Již vydaná Genoa osazená druhou generací V-cache = Genoa-X. Tedy až 96 jader / 192 vláken a až 1152 MB L3 cache.
Kombinace nové architektury, druhé generace V-cache a vyššího počtu jader / vyšší kapacity L3 cache umožňuje Epycu Genoa-X dosahovat až 1,6-5,7× vyššího výkonu oproti předchozí generaci, Epyc Milan-X.
Ve 32jádrové konfiguraci oproti 32jádrovému Xeonu 8462Y nabízí v technických výpočtech zhruba 2× vyšší výkon.
Epyc | jád. / vl. | základ / boost všejádrový / jednojádr. | L3 cache | TDP |
---|---|---|---|---|
9684X | 96 / 192 | 2,55 / 3,42 / 3,7 GHz | 1152 MB | 400W |
9384X | 32 / 64 | 3,1 / 3,5 / 3,9 GHz | 768 MB | 320W |
9184X | 16 / 32 | 3,55 / 3,85 / 4,2 GHz | 768 MB | 320W |
Vydány byly tři modely s okamžitou dostupností: S 96, 32 a 16 jádry.
P4 DPU
Je tomu akorát rok, co AMD dokončila akvizici společnosti Pensando, která je zaměřená na pokročila síťová řešení. Její síťový procesor (DPU, data processing unit) P4 AMD vnímá jako prvek, který může podstatně zvýšit výkon a bezpečnost cloudových řešení.
U klasického konceptu totiž probíhá režie jako firewall, šifrování a NAT (network address translation) na úrovni x86 jader, což u některých typů nasazení může znamenat, že x86 (CPU) jádra jsou až ze třetiny vytížena režií.
AMD nabízí možnost přesunutí těchto (a dalších) úloh na DPU, která v podobě P4 považuje za nejpokročilejší na trhu.
Instinct MI300
Když AMD v květnu naťukla Instinct MI300 ve spojitosti s chystaným superpočítačem El Capitan, byla zmíněna konkrétně varianta MI300A, což dávalo tušit, že verzí Instinct MI300 bude vícero. To bylo oficiálně potvrzeno a představeny rozdíly mezi MI300A a MI300X.
Instinct MI300A, na kterém vznikne zmíněný superpočítač EL Capitan, obsahuje jak procesorová jádra (24 jader Zen 4), tak jádra GPGPU / CDNA 3. Ačkoli se dosud na základě obrázků předpokládalo, že akcelerátor nese 4 5nm čiplety, z čehož 1 je procesorový (24 jader Zen 4) a tři výpočetní (CDNA 3), ve skutečnosti nejde o čtyři čiplety, protože tyto čtyři části nejsou monolitické, ale tvořené více čiplety umístěnými těsně u sebe. Procesorová část je tvořena třemi čiplety (tzn. po osmi jádrech na každý, podobně jako u Epyců Genoa) a tři grafické části jsou tvořené ze dvou CDNA 3 čipletů každá, tzn. že MI300A nese 6 CDNA 3 čipletů celkem. Celkový počet čipletů (včetně 6nm) je 13, počet tranzistorů odpovídá 146 miliardám. AMD tak bude mít na světě první XPU („výpočetní APU“) o minimálně tři roky v předstihu před Intelem, který své plány původně mířené na rok 2024 zrušil a v roadmapě již neuvádí žádné XPU ani v roce 2025.
Instinct MI300X je novinka, o této variantě dosud nebylo slyšet. Oproti MI300A nahrazuje 3 CPU čiplety dvěma CDNA 3 čiplety, takže bude fungovat klasicky jako akcelerátor (ke kterému je zapotřebí doplnit nějaký procesor). Obsahuje tedy celkem 12 čipletů (6 5nm CDNA 3). To však není jediný rozdíl. AMD navýšila kapacitu HBM3 pamětí ze 128 GB na 192 GB (s propustností 5,2 TB/s), do které se vejdou i ty nejnáročnější jazykové modely pro AI, ještě s určitou rezervou pro další rozvoj. Čiplety propojuje Infinity Fabric s propustností 896 GB/s.
Na bázi MI300X pak AMD postaví systém nazvaný AMD Instinct Platform nabízející 8 těchto akcelerátorů, 1,5 TB HBM3 a standardní provedení na desce pro OAM moduly.
Instinct MI300A již AMD dodává v podobě vzorků, vzorky Instinct MI300X začne dodávat v létě (třetím kvartálu) a sériově vyráběné kusy půjdou do světa ve čtvrtém kvartálu.