Intel se pochlubil Xeony Sapphire Rapids a Xe-HPC se 100 miliardami tranzistorů
Začněme akcelerátorem Ponte Vecchio, Xe HPC. Intel poodhalil některé parametry na dvojici velmi podobných slajdů (níže), které se částečně liší tím, že první uvádí počty platné pro konkrétní dlaždici a druhý počty pro celý akcelerátor. Tak například když specifikace uvádějí 4 MB L1 cache na dlaždici (slajd vlevo) a celé Xe HPC nese 16 výpočetních dlaždic, znamená to 64 MB L1 cache celkem (vpravo).
Trochu méně srozumitelné je, jak Intel z hodnoty 144 MB L2 cache na dlaždici získal celkovou hodnotu 408 MB L2 cache (pokud máte nápad, klidně se pochlubte v diskuzi - přiznávám, že na to jsem nepřišel).
Podrobnější specifikace však Intel zatím drží pod pokličkou, takže počty jednotek, takty nebo výkonnostní údaje zatím v naší tabulce chybí.
AMD Instinct MI250X | Intel Xe-HPC | Nvidia A100 | |
---|---|---|---|
GPU | Aldebaran | Ponte Vecchio | GA100 |
architektura | CDNA 2 | Xe | Ampere |
formát | OAM | OAM | SXM4 |
CU/SM | 220 (256) | 128 | 108 |
FP32 jader | 14080 (16384) | ? | 6912 |
FP64 jader | - | ? | 3456 |
INT32 jader | - | ? | 6912 |
Tens. Cores | 880 | ? | 432 |
takt | ≤1700 MHz | ? | 1410 MHz |
↓↓↓ T(FL)OPS ↓↓↓ | |||
FP16 | 383 | ? | 78 |
BF16 | 383 | ? | 39 |
FP32 | 95,7 47,9 | ? | 19,5 |
FP64 | 47,9 | ~37 ? | 9,7 |
INT4 | 383 | ? | ? |
INT8 | 383 | ? | ? |
INT16 | ? | ? | ? |
INT32 | ? | ? | 19,5 |
FP16 tensor | 383 | ? | 312/624* |
BF16 tensor | 383 | ? | 312/624* |
FP32 tensor | 95,7 | ? | 19,5 |
TF32 tensor | ? | 156/312* | |
FP64 tensor | 95,7 | ? | 19,5 |
INT4 tensor | ? | 1248/2496* | |
INT8 tensor | 383 | ? | 624/1248* |
↑↑↑ T(FL)OPS ↑↑↑ | |||
TMU | - | ? | 432 |
LLC | 16 MB | 408 MB | 40 MB |
sběrnice | 8192bit | 8192bit? | 5120bit |
kapacita paměti | 128 GB | 128 GB? | 80 GB |
HBM2 | 3,2 GHz | HBM2E | 3,20 GHz |
paměť. propustn. | 3277 GB/s | ? | 2048 GB/s |
TDP | 500W 560W | ~615W? | 400 W ≤600 W |
transistorů | 58,2 mld. | 100 mld. | 54,2 mld. |
plocha GPU | ? | ? | 826 mm² |
proces | 6 nm | Intel 7 7nm, 5nm | 7 nm |
datum | 2021 | 2022 | 2020 |
Redakce webu Anandtech ale na základě čísel, které Intel uvádí o celém superpočítači Aurora, z počtu použitých procesorů a akcelerátorů odvodila přibližný výkon 37 FP64 TFLOPS na akcelerátor při zhruba 615 wattech.
Jednotlivé dlaždice Xe-HPC jsou vyráběné na třech různých procesech: Intel 7 a dva procesy TSMC: 7nm a 5nm. Naproti tomu AMD na čerstvě vydaném Instinct MI250X používá 6nm (tj. v podstatě 7nm s EUV).
Přejděme k Xeonům. Aby Intel dostal novináře do nálady, přišel nejdříve s grafem srovnávajícím výkon Xeonů s Epycy od AMD. Někteří redaktoři byli vysokými čísly Xeonů natolik omámení, že tento slajd prezentují jako výsledky Xeonů Sapphire Rapids - ve skutečnosti jde však o současnou (třetí) generaci, tedy Xeony Ice Lake:
Tedy tu generaci, která v prvních nezávislých testech zvládala sotva konkurovat Epycům s jádrem Zen 2 a která v našem testu dopadla tak, že šestnáct jader Ice Lake je v průměru na úrovni šestnáctijádrového Threadripperu X1950:
- Po letech odkladů vydává Intel Xeony Ice Lake
- RECENZE: Intel® Server System M50CYP2UR208 - dva 10nm Intel Xeony Ice Lake
Nelze proto mít těmto redaktorům za zlé, že si tato superlativa a hodnoty o desítky procent překonávající 64jádrový Zen 3 nespojili s Ice Lake, který má reálně problémy i s 32jádrovými modely, a považovali je za prezentaci budoucí generace.
Nyní k té budoucí generaci - Sapphire Rapids. Intel zveřejnil pěkné schéma tohoto Xeonu, které nese čtyři procesorové dlaždice a čtyři čipy HBM2e o celkové kapacitě 64 GB. Jak ale již víme, první generace Sapphire Rapids nebude HBM pamětmi vybavena a bude spoléhat na kombinaci cache s klasickými paměťovými moduly; vydání verze s HBM se očekává později. Obě verze se budou lišit o rozměry pouzdra - klasická má 78 × 57 mm, s HBM 100 × 57 mm. Pouzdro klasické verze integruje 10 propojovacích můstků (EMIB), pouzdro verze s HBM celkem 14.
Intel nadále ve veřejné roadmapě předkládá Xeon Sapphire Rapids s HBM jako produkt roku 2022. V polovině letošního roku uniklá oficiální roadmapa však mezi oběma verzemi uváděla půlroční interval a vzhledem k tomu, že zatím vše nasvědčuje reálné dostupnosti Xeonů Sapphire Rapids (bez HBM) v polovině roku 2022, toho modely s HBM z roku 2022 nejspíš mnoho nestihnou, pokud vůbec.