20jádrový Sapphire Rapids je vybaven 75MB L3 cache; 3,75 MB na jádro
Sapphire Rapids, velké procesory postavené na x86 architektuře Golden Cove, přinesou krom vyššího počtu jader navýšení IPC kolem (nebo alespoň - jak podle kterého zdroje) 20 % nad Intel Tiger Lake (Willow Cove) a AMD Zen 3.
První výkonnostní test ale nic takového nenaznačuje, což je ale prakticky jistě záměrem Intelu. Systém osazený dvojicí procesorů s 20 jádry a 40 vlákny v každém, nabídl v GeekBench jednojádrové skóre 1340 a vícejádrové 31 666 bodů. Na první pohled by si člověk řekl, že je to na nějaký zdaleka ne finální vzorek pěkné. Třeba 64jádrový Threadripper 3990X dává 34 462 bodů. Jenže test Sapphire Rapids neproběhl v aktuálním GeekBench 5 (jako zmíněný Threadripper), ale ve starém GeekBench 4, který je na počet bodů podstatně štědřejší.
GeekBench 4
Jak sami vidíte, 2× 20 jader procesorů Sapphire Rapids dosahuje výsledků, které bychom čekali spíše od 40 jader nějakého obstarožního Atomu než 40 jader nejpokročilejší x86 architektury dostupné (alespoň to tak Intel plánuje) roku 2021. Je prakticky jisté, že Intel výkon nějakým způsobem omezil. Rozhodně nejde jen o omezení frekvencí (základní takt je sice omezen na 1,5 GHz, ale během testu bylo dosaženo boostu až 4,7 GHz), neboť ani kdybychom výsledky vynásobili třemi (což by odpovídalo 4,5GHz základnímu taktu), stále by se ani neblížily očekávanému výkonu. Jednojádrový výkon bychom museli vynásobit asi sedmi, vícejádrový zhruba čtrnácti. Intel zde zjevně zatáhl nějakou ruční brzdu, aby ověřil, že procesor testem projde, ale neprozradil nic o jeho reálném výkonu.
Informačně bohatší než výkonnostní skóre jsou tak údaje o konfiguraci cache.
proces | L1 (dat.+instr.) | L2 | L3 | |
---|---|---|---|---|
Broadwell | 14nm | 64 kB (32+32) | 256 kB | 1,5 MB |
Broadwell-E | 14nm | 64 kB (32+32) | 256 kB | 2,5 MB |
Skylake | 14nm | 64 kB (32+32) | 256 kB | 2 MB |
Skylake-X | 14nm | 64 kB (32+32) | 1024 kB | 1,375 MB |
Canon Lake | 10nm | 64 kB (32+32) | 256 kB | 2 MB |
Ice Lake | 10nm | 80 kB (48+32) | 512 kB | 2 MB |
Ice Lake-SP | 10nm | 80 kB (48+32) | 1280 kB | 1,5 MB |
Tiger Lake | 10nm | 80 kB (48+32) | 1280 kB | 3 MB |
Alder Lake (GldnCv) | 10nm | 80 kB (48+32) | 1280 kB | 3 MB |
Sapphire Rapids | 10nm | 80 kB (48+32) | 2048 kB | 3,75 MB |
Jak je obvyklé a očekávatelné (na základě zkušenosti s rozdílem mezi desktopovým Skylake a serverovým Skylake-X nebo s „desktopovým“ Ice Lake a serverovým Ice Lake-SP), kapacita L2 na jádro je v případě serverové verze jádra Golden Cove (Sapphire Rapids) vyšší než u desktopové verze (Alder Lake). Zatímco u předchozích architektur bylo zvětšení L2 cache kompenzováno zmenšením L3 cache, v případě testovaného vzorku Sapphire Rapids se toto neděje. Kapacita je naopak vyšší než u Alder Lake. V úvahu připadají dvě možná vysvětlení. Buďto se Intel díky nasazením čipletů, respektive dlaždice (tiles) přestal tak úzkostlivě starat o každý čtvereční milimetr plochy (u monolitů to byl problém, výtěžnost při výrobě monolitů klesá s rostoucí plochou exponenciálně), nebo tento vzorek nereprezentuje konfiguraci finálních produktů a má aktivní dvojnásobek L3 cache na jádro, než bude obvyklé (pak by cílová hodnota odpovídala 1,875 MB - což je stále více než u Ice Lake-SP). Kloním se ale spíš k první možnosti.
Jen pro úplnost a jednoznačnost tabulky je potřeba doplnit, že hodnota „3 MB“ pro desktopový Alder Lake ignoruje malá jádra (Atomy) a uvádí kapacitu L3 cache na jedno velké jádro - těch je 8, kapacita L3 cache 24 MB, takže na jedno velké jádro vychází v průměru 3 MB.