Intel předbíhá AMD, představil Max Series: Ponte Vecchio a Xeony Sapphire Rapids
V předstihu před akcí Supercomputing 2022 (neděle 13. listopadu - pátek 18. listopadu, Dallas) ohlásil Intel dva velmi dlouho očekávané kousky hardwaru, které nazval souborně Max Series.
Xeon Max CPU alias Sapphire Rapids HBM
Navzdory původním plánům (Intel měl vydat standardní Xeony Sapphire Rapids a cca půl roku po nich verzi s HBM pamětmi) nyní hovoří pouze o HBM konfiguraci a procesory Xeon Max prezentuje jako první x86 produkt osazený HBM pamětmi. Procesory nabídnou až 56 výkonných x86 jader rozdělených do čtyř dlaždic (čipletů) spojených můstky EMIB a dosahujících celkem 350W TDP.
Procesory budou vybavené 64 GB HBM paměti, rozhraním PCIe 5.0 a CXL 1.1.
Intel uvádí následující výhody (přeloženo z tiskové zprávy Intelu):
- o 68 % nižší spotřeba než cluster AMD Milan-X při stejném HPCG výkonu
- AMX instrukce zvyšující výkon v AI a přinášející až 8× vyšší propustnost oproti AVX-512 pro formát INT8 s INT32 akumulací
- přináší flexibilitu s možností fungovat v různých HBM a DDR konfiguracích
- výkonnostní testy:
- model klimatu: 2,4× rychlejší než cluster AMD Milan-X v MPAS-A pouze s použitím HBM
- molekulární dynamika: v DeePMD, 2,8× vyšší výkon oproti konkurenčním produktům s DDR4 pamětí
Max Series GPU alias Ponte Vecchio
Max Series GPU (takto se skutečně oficiálně označuje) předkládá Intel jako svůj procesor s nejvyšší denzitou, který obsahuje 100 miliard tranzistorů v rámci pouzdra nesoucího 47 dlaždic (čipletů) s až 128 GB paměti typu HBM.
Obsahuje a dosahuje:
- až 128 Xe-HPC jader
- 408 MB L2 cache - nejvíce v oboru - a 64 MB L1 cache pro zvýšení propustnosti a výkonu
- jediné HPC/AI GPU s nativní podporou pro raytracing, navržené pro vědecké vizualizace a animace
- výkonnostní testy:
- finance: 2,4× rychlejší oproti Nvidia A100 v zátěži Riskfuel credit option pricing
- fyzika: 1,5× rychlejší oproti Nvidia A100 v NekRS virtual reactor simulations
Max Series GPU bude k dispozici v následujících konfiguracích:
- Max Series 1100 GPU: 300W PCIe karta s dvojnásobnou šířkou a 56 Xe jádry se 48 GB HBM2e; jednotlivé karty lze propojit přes můstky Intel Xe Link
- Max Series 1350 GPU: 450W OAM modul se 112 Xe jádry a 96 GB HBM
- Max Series 1550 GPU: nejvýkonnější konfigurace Intelu s 600W OAM modulem se 128 Xe jádry a 128 GB HBM
Krom jednotlivých karet a modulů nabídne Intel subsystém Intel Data Center GPU Max Series s deskou pro ×4 GPU v OAM modulu a Intel Xe Link pro dosažení vysoké datové propustnosti mezi GPU v systému.
Výčty specifikací byly citovány pokud možno tak přesně, jak to překlad dovolil. Dále už to bude s omáčkou: V první řadě zaujme, že Intel ohlašuje produkty před akcí Supercomputing 2022, navzdory tomu, že žádný z nich nebude letos dostupný. Proč s ohlášením nepočkat pár dní, když se na produkty bude čekat (v nejlepším případě) měsíce? Protože bylo potřeba alespoň o hodiny předběhnout AMD, která chystá vydání Epycu 4. generace. Případná srovnání Epycu oproti procesorům Xeon Ice Lake, která budou pro Intel dopadat silně katastroficky, tak mohou být bagatelizována vysvětlením, že nejde o aktuální generaci, která je mnohem rychlejší.
V diskuzích se objevily názory, že Intel označením produktů i grafikou prezentací přejímá styl Applu. To je pravda, nicméně v rámci prezentací (začala s tím nová grafická divize Intelu) se to děje již pár let. Souhrnné označení procesorů i grafických čipů pod termín „Max Series“ pak může mít ještě jeden důvod. Řadu Max měl Intel již v roce 2014 a šlo o 55nm FPGA. Značení Max používal Intel i pro GPU první generace Xe, používané zejména v noteboocích. Proč tedy další produkt označovaný jako „Max“, když už takových Intel má několik a minimálně ve výsledcích vyhledávačů budou promíchané?
Možnou odpověď nabízí formulace z tiskové zprávy: „Produkty Max Series jsou chystané k vydání v lednu 2023. S ohledem na naše závazky vůči zákazníkům dodává Intel blady s Max Series GPU [= Ponte Vecchio] do Argonne National Laboratory pro pohon superpočítače Aurora a bude dodávat procesory Xeon Max CPU do Los Alaoms National Laboratory, Kyoto Universiry a dalších superpočítačových středisek.“
Všimněte si, že formulací „produkty Max Series jsou chystané na leden 2023“, dále „Intel dodává blady s Max Series GPU“ a „bude dodávat procesory Xeon Max CPU“. Co to znamená: GPU akcelerátory již v nějaké podobě existují, Intel je již letos dodává na projekt zpožděného superpočítače Aurora (respektive spíše na Sunspot, což je předaurorovský testovací systém postavený na 128 bladech). Na druhé straně o procesorech se mluví v budoucím čase, bez jakéhokoli (byť jen orientačního) termínu zahájení prodejů. Intel zjevně CPU i GPU označil souhrnně jako „Max Series“, aby mohl hovořit o vydání „Max Series“ v lednu 2023, byť procesory nejsou zdaleka hotové a reálně budou vydána jen GPU.
Za pozornost stojí i velmi vágní výkonnostní srovnání hovořící jednou o „cluster Milan-X“ bez specifikace modelu a konfigurace, podruhé o „oproti konkurenčním produktům s DDR4“ (což je třeba i 28nm APU Bristol Ridge vydané před 6 lety, byť to jistě Intel nepoužil). Případně srovnávání výpočetního výkonu výpočetně orientovaného Max Series GPU s výpočetním výkonem AI-orientovaného Nvidia A100.
Celé uvedení a tisková zpráva tak působí spíš jako pokus o zachycení posledního okamžiku, kdy lze kombinací cíleného vybírání příznivých výsledků a srovnávání s generacemi, které budou v nejbližší době nahrazené novými (Nvidia H100 bude rovněž dostupná začátkem roku 2023, datum dostupnosti Epyců 4. generace ohlásí AMD večer), aby se Intel se zpožděnou generací výpočetních produktů blýsknout před akcionáři, než vyjde skutečná konkurence těchto produktů, proti které to Intel bude mít velmi těžké.