Intel dokazuje, že 56jádrový Xeon je lepší než 64j. Epyc, zkresleným srovnáním
Začátkem dubna letošní roku avizoval Intel nový Cascade Lake-AP, Xeon složený ze dvou 28jádrových procesorů (křemíků) Cascade Lake. Tento způsob realizace výkonnějšího procesoru si vyžádal i nové rozhraní, takže řada „AP“ není kompatibilní s deskami pro jiné Xeony. Až na nějaké drobnosti a úniky prvních výsledků nebylo o Xeon Platinum 9282 (jak se produkt jmenuje) slyšet, až nyní. Intel rozjel marketingovou propagaci a v jejím rámci vznikl i slajd s grafy, které dokládají, že 56jádrový procesor Intel je v průměru o 31 % rychlejší než 64jádrový procesor od AMD:
Slajd vypadá velmi profesionálně, předkládá průměr dokonce z dvanácti výsledků, takže by se mohlo zdát, že si Intel své postavení v serverovém segmentu opět obhájil i přes nové produkty AMD. Druhý pohled ale odhalí celou řadu nesrovnalostí, kterou Intel s elegancí baletky z Labutího jezera odignoroval.
1. TDP: 400W pro Xeon, 225W pro Epyc
Intel jaksi „přehlédl“, že řada Epyc 77x2 je zaměřena na vyvážení energetické efektivity a výkonu, nikoli na maximální výkon. Pokud tedy člověk zohlední, že Xeony s o 78 % vyššími energetickými nároky mají o 31 % vyšší výkon, není to pro Intel zase až tak lichotivé. Někdo by mohl namítat, že je chybou AMD, že nenabídla i produkt s vyšším TDP, který by byl rychlejší. Jenže to by nebyla pravda, AMD takový produkt v nabídce má, jen ho Intel z nějakého důvodu ve svém testu nepoužil.
2. Cena: $25-50 tisíc pro Xeon, <$7 tisíc pro Epyc
Srovnání jaksi zapomnělo na pořizovací náklady. Zatímco testovaný Epyc stojí doporučených $6950, cena Xeonu je násobně vyšší. Intel ovšem ani téměř tři čtvrtě roku od vydání přesnou cenu nezveřejnil, uvádí jen u nižší řady končící 28jádry, kde top model vyjde na $17 906. Předpokládá se, že Cascade Lake-AP složený ze dvou 28jádrových křemíků je natolik specifickou záležitostí, že se cena určuje tzv. Scottovou metodou dávkování elixíru mládí: Co kdo snese. Takový názor zastává i redakce webu Anandtech, podle níž by se cena - v závislosti na konexích zákazníka, marži prostředníka a výši odběru - mohla pohybovat mezi $25-50 tisíci dolary za 56jádrový Xeon. Za částku, kterou stojí 2 Xeony, tak lze pořídit 7-14 Epyců. S výkonem (odvozeným ze slajdu Intelu) 2,7-5,3× vyšším.
3. Model: HPC úlohy na HPC modelu Intelu srovnávané s ne-HPC modelem AMD
Očekávali byste, že když bude zákazník stavět HPC systém, vybere si pro něj procesory optimalizované pro HPC? Ne tak Intel. Ten zcela vyignoroval, že AMD vydala i Epyc 7H12 (písmeno H znamená HPC) určený pro HPC systémy, kde je klíčový výkon v kontinuální zátěži všech jader. Tento model má vyšší (280W oproti 225W) TDP a vyšší garantovaný základní takt 2,6 GHz (oproti 2,25 GHz). Již v září tento procesor využívaly systémy společnosti ATOS, takže nejde o nějaký papírový produkt, který by byl zákazníkům hůře dostupný než 56jádrový Xeon.
4. Rozhraní a platforma
Xeon Platinum 9282 si v důsledku svého atypického provedení (složen ze dvou velkých 28jádrových monolitů) táhne onu příslovečnou kouli na noze. Přesněji řečeno jde o 5903 kuliček, které vytvářejí jeho BGA rozhraní. Nejde zkrátka o produkt do socketu, jak je u výkonných serverů obvyklé. Tím je eliminována možnost upgradu, zároveň pak komplikována situaci při poruše čehokoli na základní desce (včetně procesoru).
Zatímco na platformě AMD může zákazník volit mezi procesory od 8 jader do 64 jader a v tomto rozmezí i upgradovat (a to i mezigeneračně), v případě Intelu si může vybrat, zda půjde do platformy, kde je upgrade omezen na procesor s ne více než 28 jádry, nebo do platformy, která dává na výběr 48 nebo 56 jader, ale možnost upgradu neexistuje.
Tato fakta sice nemají vliv na výkon, jaký Intel naměřil, ale mají vliv na dodatečné náklady v případě upgradu nebo poruchy.
5. Testy: Výběr Intelu
Slajd je postavený na výběru testů, které zvolil Intel. Žádný výrobce (pokud tím nesleduje nějaký specifický cíl) nezahrne testy, ve kterém by se jeho hardwaru vedlo vysloveně špatně, to je jasné. Intel je ale v posledních letech při prezentaci svého hardwaru ve volbách testů natolik nekonzistentní, že stíhá odporovat vlastním argumentům výběru - zkrátka vždy vybírá extrémní tzv. „best case“ případy a sekundárně vymyslí důvody, proč právě takový výběr je nejobjektivnější. Příkladem může být např. loňská prezentace výsledků procesorů Core v CineBench a letošní odsouzení CineBench jako neobjektivního a pro-AMD benchmarku. Případně argumentaci pro testování výkonných desktopových procesorů postavenou na výsledcích ankety konané mezi uživateli tabletů, ultrabooků a notebooků.
6. Verze testů: Zastaralá verze testu bez podpory Zen 2
Jedna věc je, jaký test Intel zvolil a druhá, jakou verzi daného testu pro srovnání vybral. Redakce webu ServeTheHome si totiž všimla, že Intelem použitá verze testu GROMACS (první graf, „Life and Material Science) je neaktuální vydání. Přes měsíc je již k dispozici aktualizovaná verze, která opravila detekci procesorů Zen 2.
„The AMD Zen 2 architecture is now detected as different from Zen 1 and uses 256-bit wide AVX2 SIMD instructions (GMX_SIMD=AVX2_256) by default. Also the non-bonded kernel parameters have been tuned for Zen 2. This has a significant impact on performance.“ |
Původní verze je totiž nerozlišovala od Zen (1) a z toho důvodu nevyužívala 256bit AVX2 akceleraci (GMX_SIMD=AVX2_256). Podle autorů testu má tato oprava pro Zen 2 „výrazný dopad na výkon“.
7. Odlišné nastavení Xeon vs. Epyc
Intel popisuje nastavení, které ve zmíněném testu použil a uvádí, že zatímco na systému s Xeonem bylo umožněno využívat až 224 vláken (2 Xeony s 56 jádry ×2 vlákny = 224), na systému s Epycem, který disponoval 256 vlákny (2 Epycy s 64 jádry ×2 vlákny = 256) nastavil jako maximum 128 vláken. Dále byl odlišně nastaven počet uzlů NUMA a pro Xeon byl manuálně vypnut boost (což by mohlo souviset s faktem, že při použití AVX je u procesorů Intelu obvykle řízením spotřeby („boostem“) nastavena nižší taktovací frekvence než bez AVX). Ať už mají tyto rozdíly v nastavení jakýkoli dopad, vyvolávají otázky především proto, že Intel nijak nevysvětluje, proč k nim vůbec přistoupil.
8. Sestava
Zatímco pro 56jádrový Xeon existuje jediná konfigurace (základní deska) od Intelu vyladěná pro daný produkt, pro Epyc existuje řada desek. Intel pro AMD zvolil Supermicro AS-2023-TR4, které je podle útržkovitých parametrů uvedených Intelem (podpora Epyců řady 7002 v kombinaci s DDR4-3200) revizí desky 2.0 pro H11 platformu. Ta nepodporuje PCIe 4.0, kterým je vybaven procesor. Absence podpory PCIe 4.0 nebude mít relevantní dopad na výkon v takto koncipovaném měření, ale ilustruje to, že Intel - aniž by do srovnání zahrnul pořizovací náklady - zvolil pro AMD jednu z nejlevnějších platforem, jakou mohl (což je při násobně dražší platformě Intelu zvláštní). I přesto tato platforma (a stejně tak testovaný model Epycu) podporuje zvýšení TDP z výchozích 225 wattů na 240 wattů, čímž by se alespoň symbolicky mohla přiblížit 400W TDP Intelu. Tuto možnost však Intel nevyužil a testoval Epyc na 225W TDP.
Pokud se při zohlednění těchto bodů podíváme na další graf, který Intel předložil a který staví v Intelem vybraných testech 56jádrový Xeon Platinum 9282 (již jen) o 13 % nad Epyc 7742, pak by už jen při hypotetickém použití HPC Epycu 7H12 musel produkt Intelu skončit jako horší volba a to i bez zohlednění násobně vyšší ceny, téměř o polovinu vyšší TDP a omezení vyplývajících z BGA rozhraní.
Redakce webu ServeTheHome situaci komentovala vyjádřením, že zhruba do roku 2017 bylo možné výsledky naměřené v laboratořích Intelu považovat za vcelku objektivní. Dnes jsou produktem „týmu výkonnostní strategie“, který tyto laboratoře vede.