Nová V-cache pro Zen 4 je nejhustší kousek křemíku ve světě PC hardwaru
AMD čas od času zveřejní technologické detaily o svém hardwaru, které zahrnují mikrosnímky čipů, počty tranzistorů, rozměry, změny o předchozí generaci a podobně. V případě Zen 4 jsme si museli trochu počkat, neboť během roku jsou dvě příležitosti, při kterých se zveřejnění takových údajů hodí: HotChips v srpnu a ISSCC koncem února. Protože byl Zen 4 uvedený krátce po HotChips, museli jsme si téměř pololetí počkat na ISSCC.
V první řadě jsme se dozvěděli specifikace čipletů používaných na produktech s jádry Zen 4. Doposud jsme uváděli pouze naše vlastní odhady, které se v případě centrálního serverového čipletu (~11 miliard tranzistorů) prakticky přesně trefily. U centrálního čipletu pro desktop (AM5) je použito 3,37 miliardy tranzistorů, což je oproti našemu předpokladu o něco více (důvod bude patrně dán integrovanou grafikou, která poněkud mění poměr logiky a SRAM, které mají odlišnou denzitu).
↓ komponenty ↓ | plocha | tranzistory |
---|---|---|
12nm modul Zeppelin (Zen) | 212 mm² | 4,8 mld. |
7nm čiplet (Zen 2) | 74 mm² | 3,9 mld. |
7nm čiplet (Zen 3) | 80,7 mm² | 4,15 mld. |
5nm čiplet (Zen 4) | 71 mm² | 6,57 mld. |
12nm IO čiplet (Ryzen / Zen 2/3) | 125 mm² | 2,09 mld. |
12nm IO čiplet (Epyc / Zen 2/3) | 416 mm² | 8,34 mld. |
6nm IO čiplet (Ryzen / Zen 4) | 122 mm² | 3,37 mld. |
6nm IO čiplet (Epyc / Zen 4) | 396,6 mm² | ~11 mld. |
7nm V-cache (Zen 3) | 41 mm² | 4,7 mld. |
7nm V-cache (Zen 4) | 36 mm² | ~4,7 mld. |
↓ produkty ↓ | ||
Ryzen 1000 / 2000 | 212 mm² | 4,8 mld. |
Ryzen 3000 6-8 jader | 199 mm² | 5,99 mld. |
Ryzen 3000 12-16 jader | 273 mm² | 9,89 mld. |
Ryzen 5000 6-8 jader | 206 mm² | 6,24 mld. |
Ryzen 5000 12-16 jader | 286 mm² | 10,4 mld. |
Ryzen 7000 6-8 jader | 193 mm² | 9,94 mld. |
Ryzen 7000 12-16 jader | 264 mm² | 16,51 mld. |
Epyc (Naples / Zen) | 848 mm² | 19,2 mld. |
Epyc (Rome / Zen 2) | 1008 mm² | 39,54 mld. |
Epyc (Milan / Zen 3) | 1062 mm² | 41,54 mld. |
Epyc (Genoa / Zen 4) | 1249 mm² | 90 mld. |
Vše je zahrnuto do naší přehledové tabulky.
Údaje o procesorovém čipletu (CCD), který je z valné části tvořen osmijádrovým komplexem (CCX) jsou převážně shrnutím již známých údajů. Dozvídáme údaje především o rozhraní (dosahuje až 36 Gb/s) a obvodech pro řízení čipletu.
Následují údaje o cache. Vlevo vidíte srovnání L3 cache Zen 4 a Zen 3. Ke zmenšení nad rámec výrobního procesu došlo především v oblasti tagů a rozhraní TSV pro připojení V-cache, které zmenšilo téměř o třetinu. Díky vyšší hit-rate L2 cache klesla dynamická spotřeba L3 o 10 %. L2 cache (vpravo) mezigeneračně zdvojnásobila kapacitu, takže navzdory zmenšení jejích částí v poměru k jednotce kapacity se celková plocha využívaná L2 cache zvětšila.
Díky úzké spolupráci s TSMC se AMD podařilo dosáhnout škálování denzity nad rámec standardních specifikací 5nm (N5) procesu TSMC, takže navzdory větším x86 jádrům a 2× větší L2 cache celková plocha CCX významně klesla. Čiplety dále využívají 15 kovových vrstev, což je jeden z prvků umožňující mezigenerační zvýšení taktovacích frekvencí.
2. gen. V-cache | 1. gen. V-cache | Zen 4 CCD | Zen 3 CCD | Zen 4 IO | Zen 3 IO | |
---|---|---|---|---|---|---|
proces | 7nm | 7nm | 5nm | 7nm | 6nm | 12nm |
datová propustnost | 2,5 TB/s | 2,0 TB/s | - | - | - | - |
plocha | 36 mm² | 41 mm² | 66,3 mm² | 80,7 mm² | 122 mm² | 125 mm² |
tranzistorů | ~4,7 mld. | 4,7 mld. | 6,57 mld. | 4,15 mld. | 3,37 mld. | 2,09 mld. |
denzita [mil./mm²] | 130,6 | 114,6 | 99 | 51,4 | 27,6 | 16,7 |
V-cache druhé generace použitá na Zen 4 je skutečně hustá, její denzita se navzdory zachování staršího procesu díky optimalizacím AMD zvýšila na zhruba 131 milionu tranzistorů na čtvereční milimetr. Tím nepřekonává pouze 6/7nm čipy, ale také všechny 5nm a 4nm čipy používané pro PC hardware. I 4nm Nvidia AD102 pro GeForce RTX 4090) dosahuje nižší hodnoty (125,5 milionu tranzistorů na milimetr čtvereční).
Závěrem se můžeme podívat na snímek centrálního (IO) čipletu procesorů Ryzen 7000, na který upozornil twitterový příspěvek Li Jae-Yeon.
Pro lepší názornost přikládám (vlevo) snímek popsaný uživatelem Locuza. Vpravo doplňuji totéž, ale s o něco detailnějším podkladem, na kterým jsem přesunul Locuzovy popisky.
Všimněte si, jak malou část jádra zabírá výpočetní jádro RDNA 2 grafiky (128 stream-procesorů), oproti kterému jsou (více než) 2× větší i obvody pro zpracování videa a obrazová pipeline.
Li Jae-Yeon, Locuza, AMD