Diit.cz - Novinky a informace o hardware, software a internetu

Bergamo: 2× více jader a L2 cache v čipletu, stejný proces, <10 % větší plocha

Zdroj: SemiAnalysis

Snímky Epycu Bergamo prozradily, co AMD dokázala dosáhnout s jádry Zen 4c. Při stejném 5nm procesu TSMC je plocha křemíku potřebná k implementaci 16 jader o 45 % nižší než u klasického Zen 4…

Epyc Bergamo je první serverový produkt, který bude využívat jádra Zen řady „c“. Jejich cílem je vměstnat maximální výkon na minimální plochu křemíku a to bez omezení funkcionality oproti standardním jádrům. AMD při vývoji využila jak obecné charakteristiky, tak specifika cloudového segmentu, pro který je Bergamo určen, takže část optimalizací šla na míru.

Srovnání Epyc Genoa (vlevo) s Epyc Bergamo (vpravo), SemiAnalysis

Zatímco čiplet klasického Zen 4 dosahuje při osmi jádrech plochy 66,3 mm², čiplet Zen 4c vybavený šestnácti jádry (tedy dvojnásobkem) měří 72,7 mm², tedy jen o 9,65 % více. Přitom krom (již uvedeného) dvojnásobku jader nese též dvojnásobek L1 cache, dvojnásobek L2 cache, pouze kapacita L3 cache na čiplet zůstala zachována. Jinými slovy kapacita L1 a L2 cache na jádro zůstala stejná, kapacita L3 cache na jádro je poloviční. Proč zrovna L3 cache? Právě proto, že cloudové úlohy neprofitují z velké sdílené cache, ale podstatnější pro ně je cache exkluzivní pro jádro (zde L2, která nebyla zmenšena). Této charakteristiky AMD dále využila zjednodušením struktury, kdy každá osmice jader má vlastní L3 cache. Čiplet tedy není vybaven jednolitou L3 dostupnou všem jádrům, protože by to vyžadovalo plochu křemíku navíc a v cílovém segmentu nepřinášelo zásadnější výhody.

Srovnání plochy částí Zen 4 oproti Zen 4c, SemiAnalysis

Logika pak byla optimalizována pro snížení plochy bez dopadů na funkcionalitu, takže x86 jádro se zmenšilo o ~35 %, FPU zhubla skoro o 39 % a front end se zmenšil dokonce o 47 %.

Osmijádrový čiplet Zen 4 (nahoře) oproti šestnáctijádrovému čipletu Zen 4c (dole), SemiAnalysis

Celkově klesla plocha čipletu při srovnání křemíku potřebného k implementaci stejného počtu jader o 45 %. Podpory instrukčních sad jsou zachovány, IPC je zachováno, podpora SMT je zachována. Optimalizace mají dopad pouze na taktovací frekvence: Zatímco Epyc 9654 (96× Zen 4, Genoa) dosahuje základního taktu 2,4 GHz a jednojádrového boostu 3,7 GHz, Epyc 9754 (128× Zen 4c, Bergamo) má základní takt 2,25 GHz (o 150 MHz / 6,25 % nižší) a boost 3,1 GHz (o 600 MHz / 16,22 % nižší). Z opačného pohledu: K dosažení o 150 / 600 MHz vyššího taktu potřebuje Genoa o 82,4 % více křemíku.

Srovnání jádra Zen 4 s L2 cache (nahoře) se Zen 4 s L2 cache (dole), SemiAnalysis

Tyto charakteristiky je opět potřeba hodnotit optikou cloudu a neextrapolovat je do desktopu (nelze předpokládat, že v desktopu by Zen 4c byl schopný dosahovat jen o 600 MHz nižšího taktu, tedy 5,1 GHz, než stávající 5,7GHz Zen 4 (Ryzen 9 7950X). Naopak v cloudu, kde se jednojádrový boost prakticky nedostává ke slovu, bude rozdíl taktů při vytížení všech jader jistě podstatně nižší než teoretických 600 MHz pro jednojádrový boost. Což opět s ohledem na segment minimalizuje míru kompromisů vedoucích ke zhuštění návrhu.

Specifikace top modelu Epyc s jádry Zen 4 (Epyc 9654) a top modelu Epyc s jádry Zen 4c (Epyc 9754),
SemiAnalysis

I se zohledněním nižších taktů dosahuje 128jádrové Bergamo o ~25 % vyššího teoretického výkonu než 96jádrová Genoa. Při stejném výrobním procesu, stejném TDP a při úspoře 214 mm² / 27 % 5nm křemíku.

Nabízí se srovnání s Atomy Gracemont, které aktuálně ve svých procesorech využívá Intel:

jádroprocesjádrojádro vč. L2 cachekapacita L2 cacheSMTAVX-512
GracemontIntel 71,70 mm²2,20 mm²0,5 MB
Zen 4cTSMC 5nm1,43 mm²2,48 mm²1,0 MB

Atomy Gracemont jsou o 19 % větší. Při započtení L2 cache je větší Zen 4c, což je ale dáno tím, že Gracemont je vybaven jen poloviční kapacitou L2 na jádro. Při stejné kapacitě L2 cache by byl Gracemont rovněž větší. Dá se říct, že je v tomto srovnání znevýhodněn starším procesem, na druhou stranu je zase co do plochy zvýhodněn absencí podpory SMT (HT) a AVX-512. Vzhledem k tomu, že Zen 4c bude mít zhruba o polovinu vyšší IPC než Gracemont a k tomu podporu SMT, kterou lze při vícejádrové zátěži získat další desítky procent výkonu navíc, může při podobné ploše jedno jádro Zen 4c plus mínus konkurovat výkonu dvou jader Gracemont.

Tagy: 
Zdroje: 

Diskuse ke článku Bergamo: 2× více jader a L2 cache v čipletu, stejný proces, <10 % větší plocha

Pátek, 9 Červen 2023 - 07:52 | eXponencial | bravo AMD !
Pátek, 9 Červen 2023 - 07:17 | Ji Si | Z čeho usuzuješ, že neuspěl? Vyvinul si vlastní...
Pátek, 9 Červen 2023 - 06:09 | Anonym | To ale nic nemění na mém tvrzení. Amazon měl...
Pátek, 9 Červen 2023 - 06:07 | Anonym | Podle informací z tohoto článku: https://diit.cz/...
Čtvrtek, 8 Červen 2023 - 21:12 | Kutil | Jsem zvědavý, na výsledné TDP a reálné chování....
Čtvrtek, 8 Červen 2023 - 21:11 | Kutil | Je otázka, kolik tranzistorů by tím bylo ušetřeno...
Čtvrtek, 8 Červen 2023 - 21:03 | Ji Si | Neexistuje. Nebo si snad můžeš koupit server s...
Čtvrtek, 8 Červen 2023 - 20:33 | Kutil | Rozhodně i tam, kde záleží na poměru výkonu a...
Čtvrtek, 8 Červen 2023 - 20:20 | Anonym | To ale platí jen pro těžký MT. Mimo servery to...
Čtvrtek, 8 Červen 2023 - 20:00 | no-X | On právě je vhodný pro úlohy náročné na CPU....

Zobrazit diskusi