Diit.cz - Novinky a informace o hardware, software a internetu

Jak je to ve skutečnosti s HT/SMT a energetickou efektivitou?

Zdroj: Intel

V souvislosti s nadcházejícími procesory Intelu se hodně mluví o technologii Hyper-Threading a jejím vlivu na energetickou efektivitu. Podíváme se, jaká je realita…

Už dlouho se mluví o tom, že velké jádro procesorů Arrow Lake a Lunar Lake, tedy Lion Cove (verze z Lunar Lake s menší cache bývá někdy označována jako Lunar Cove) mělo být jakýmsi přerodem od klasické x86 architektury Intelu k nové generaci, jejíž vývoj inicioval za svého působení Intelu architekt Jim Keller (a se kterou to podle aktuálních zvěstí vypadá všelijak, k tomu se ale vrátíme jindy). Nová architektura měla přinést funkci rentable units, kdy dvě jádra (menší a efektivnější) měla být schopna spojit své hardwarové prostředky pro navýšení jednovláknového IPC až o 40 %. Později se začalo proslýchat, že právě experimentování při vývoji jader Lion Cove způsobilo, že u těchto jader nefunguje HT (Hyper-Threading).

Během představení architektury Lion Cove se Intel pokusil tuto nevýhodu prezentovat jako záměr a výhodu. Tvrdil totiž, že bez HT dosahuje procesor o 15 % vyšší energetické efektivity, tedy o 15 % lepšího poměru výkon na watt. Toto tvrzení však poněkud narušil slajd, který prezentoval, že s novou architekturou je největšího nárůstu IPC dosahováno při aktivním HT, přičemž výkon narůstá více než spotřeba (tzn. poměr spotřeba / výkon je s HT výhodnější):

Hyper-Threading na Lion Cove = 30 % výkonu navíc? (Intel)

Tento slajd vyvolal diskuze téměř pod každým článkem, ve kterém se objevil a s ohledem na skutečnost, že z některých článků po vydání zmizel, lze spekulovat o tom, že se do prezentace neměl dostat a Intel požádal o jeho stažení.

Rovněž se objevovala informace, že HT bude aktivní na serverové variantě architektury. Dávalo by to smysl, ztráta HT by Xeonům na konkurenceschopnosti nepřidala, a tak je lepší využít času do vydání a HT na serverové variantě jádra zprovoznit.

Jak je to ale ve skutečnosti s HT / SMT? Zlepšuje nebo zhoršuje energetickou efektivitu? Na tuto otázku dal odpověď srpnový článek Phoronixu, který testoval APU Strix Point se zapnutým i vypnutým SMT a to jak co do výkonu, tak do spotřeby. Otestoval řadu zátěží bez ohledu na to, jak a zda jsou na HT / SMT optimalizované či nikoli (ojediněle dochází k poklesu výkonu).

OSPRay 3.2 - příklad vysokého nárůstu výkonu se SMT (Phoronix)

Zjistil, že SMT může přinést výkonnostní posun až ke zhruba 50%.

OSPRay 3.2 - příklad dopadu SMT na spotřebu při vysokém nárůstu výkonu (Phoronix)

Ve většině zátěží byla obvyklá spotřeba (červený úsek) s aktivním SMT nepatrně nižší než s vypnutým SMT. Dává to smysl - pokud jsou zatížena všechna jádra, je se SMT zátěž na jádro vyšší, což u konfigurace limitované spotřebou znamená snížení taktů a tedy běh na frekvenci bližší energetickému optimu. Naopak bez SMT jádra věží na mírně vyšším taktu, což znamená nárůst spotřeby (vyšší než nárůst výkonu). Spotřeba byla mírně vyšší jen v menšině případů, zpravidla těch, kde SMT nepřináší nebo snižuje výkon.

LuxCoreRenderer / DLSC - příklad nižšího nárůstu výkonu a dopadu na spotřebu se SMT (Phoronix)

U mobilního procesoru limitovaného spotřebou je přínos SMT (v průměru 57 optimalizovaných i neoptimalizovaných zátěží) +18 % výkonu při ~2% snížením průměrné spotřeby a ~4% snížení maximální spotřeby.

Průměrný dopad SMT (v 57 zátěžích) na výkon i spotřebu (Phoronix)

Z tohoto měření vyplývá, že vynechání HT či SMT z energetického hlediska v podstatě nedává smysl, neboť HT / SMT přináší i u energeticky silně limitovaných čipů stále dost citelný nárůst výkonu bez nárůstu spotřeby (téměř 20% zvýšení energetické efektivity v průměru a téměř 50% zvýšení energetické efektivity v extrémech).


Intel rovněž argumentoval úsporou 10 % křemíku na jádrech, které má znamenat odstranění podpora HT oproti jeho vypnutí.

Odstranění HT z Lion Cove = 10% úspora křemíku na jádru (Intel)

I když budeme hodnotě 10 % věřit, matematicky to smysl nedává. HT podporují pouze velká jádra, která jsou v procesoru Lion Cove pouze 4. Z plochy funkčního křemíku (výplňovou dlaždici ani podložku nepočítám) Lunar Lake zabírají velká jádra pouhých 9,3 %. 10 % z 9,3 % plochy křemíku je tedy celková úspora 0,93 % křemíku. Ve chvíli, kdy Intel věnoval grafice a souvisejícím prvkům desítky procent plochy procesoru a rovněž NPU (AI akcelerátoru) věnoval více křemíku než čtyřem procesorovým jádrům, působí argumentace úsporou 0,93 % plochy za cenu ztráty 15 % výkonu (dle Intelu) naprosto nelogicky.

Diskuse ke článku Jak je to ve skutečnosti s HT/SMT a energetickou efektivitou?

Pátek, 6 Září 2024 - 18:59 | Kutil | Až ten detail, že dvě jádra zabírají dvojnásobnou...
Pátek, 6 Září 2024 - 18:53 | Jencanek | a zkoušel někdo scénař 1 jádro s SMT omezené na...
Pátek, 6 Září 2024 - 18:34 | Kutil | Zatím jsou spíš spekulace, jak to funguje mimo...
Pátek, 6 Září 2024 - 18:33 | Kutil | To je otázka. Protože původní určení bylo moc...
Pátek, 6 Září 2024 - 18:31 | Kutil | HT se jim nepovedlo, proto ho vypnuli, fyzicky...
Pátek, 6 Září 2024 - 18:12 | melkor | U Zen5 se prý už ten druhý dekóder nevypíná, ale...
Pátek, 6 Září 2024 - 16:36 | Ladis | Přitom x86 potřebuje HT/SMT jako sůl. Další...
Pátek, 6 Září 2024 - 16:35 | Ladis | Možná by to zas urychlilo nástup ARMu na PC ;-)
Pátek, 6 Září 2024 - 16:31 | Waffer47 | 2C/2T, nebyt Zen-u mame to i dnes na podnose od...
Pátek, 6 Září 2024 - 16:25 | Waffer47 | Intel nenasloucha zakaznikum a proto: ->sme se...

Zobrazit diskusi