Nvidia Grace Superchip (144 jad.) ztrácí za Intel Sapphire Rapids-HBM (96 jad.)
ARM procesor Grace se 72 jádry ohlásila Nvidia na GPU Technology Conference v dubnu 2021. Řešení postavené na dvojici jader (dvojici pouzder) dostalo název Grace Superchip. Nyní, po bezmála třech letech, se objevily první nezávislé výsledky, které publikovaly dvě organizace: Barcelona Supercomputing Center a State University of New York. Obsahují i výsledky z dalších platforem pro srovnání, přičemž zajímavé jsou v tomto kontextu především výsledky Xeonů Sapphire Rapids-HBM od Intelu otestovaného jako v HBM- tak i v DDR-režimu.
Srovnání s aktuální generací AMD chybí, přítomný je jen výsledek Epyců Milan, tedy Zen 3 a to ve standardním provedení, což je v kontextu AI/výpočetních testů značné znevýhodnění (64 jader na čip namísto 96 jader na čip, nižší IPC, absence AVX-512 a nativních datových formátů používaných pro AI, nakonec i absence V-cache, která je v rámci současné nabídky AMD do jisté míry alternativou k HBM u Intelu). Zatímco srovnávané produkty Intelu a Nvidie jsou to nej, co oba výrobci aktuálně mají, v případě AMD jde o 3 roky staré řešení (vydané vlastně měsíc před tím, než Nvidia ohlásila Grace).
Grace LPDDR5 (144× Armv9) | Sapphire Rapids HBM (96× Gldn Cv) | Sapphire Rapids DDR5 (96× Gldn Cv) | Milan DDR3 (96× Zen 3) | Milan DDR5 (128× Zen 3) | |
---|---|---|---|---|---|
Matrix Multiplication | 4461 | 5392 | 4787 | 2775 | 3046 |
LINPACK | 3120 | 2862 | 2211 | 1493 | 2176 |
FFT | 134,2 | 143,1 | 129 | 42,6 | 54,7 |
HPCG | 106,5 | 197,5 | 83,6 | 53 | - |
OpenFOAM (lépe méně) | 13,87 | 14,87 | 18,39 | 23,43 | - |
Gromacs MEM | 171 | 206,1 | 203,64 | 95,31 | - |
Gromacs RIB | 12,7 | 13,52 | 13,88 | 10,33 | - |
Gromacs PEP | 0,977 | 1,2 | 1,18 | 0,92 | - |
Z osmi testů zvítězil Grace Superchip ve dvou, Sapphire Rapids v šesti. Časem může dojít ještě na určité optimalizace (např. HPCG běželo na všech x86 platformách ve verzi optimalizované pro Intel a na Grace ve verzi postrádající optimalizace specifické pro kteréhokoli výrobce), ale nějaké zásadní změny, které by změnily celkové pořadí, asi očekávat nelze. Nakonec stojí za pozornost i skutečnost, že Grace Superchip byl v plné 144jádrové konfiguraci, zatímco Sapphire Rapids pouze v podobě Xeon Max 9468, (48 jader na čip) přičemž top modelem této řady je Xeon Max 9480 s 56 jádry na čip.
Grace Superchip tedy na žádné velké výkonnostní zemětřesení nevypadá a do jeho široké dostupnosti může Intel dostat na trh v prosinci vydaný Emerald Rapids vybavený podstatně vyšší kapacitou L3 cache. Intel dále (snad na léto) plánuje vydání nové generace Xeonů Granite Rapids s až (fyzicky) 132 jádry. Dostupnost je samozřejmě věc druhá.
Jak již bylo řečeno, srovnání s AMD je problematické, protože do testů nebyl zahrnut žádný produkt ze současné generace. Epyc Milan (Zen 3) je tři roky staré řešení, které nebylo určeno a vybaveno pro akceleraci AI výpočtů. Namísto AVX-512 používá pomalejší AVX-2 a výpočty zpracovává ve vyšší (FP32) přesnosti (formát BF16 nepodporuje). Aktuální konkurencí těmto produktům by byl Epyc Genoa-X (2× 96× Zen 4 + V-cache), přičemž na letošní podzim chystá AMD Epyc Turin (2× 128× Zen 5), který krom vyššího počtu jader, nárůstu IPC a rychlejšího AVX-512 dále rozšíří podporu datových formátů vhodných pro AI.