Na HBM v PC definitivně zapomeňte, jsou řádově levnější alternativy
Budeme-li Radeon R9 Fury-X s jádrem Fiji považovat za testovací platformu HBM pamětí, pak technologie HBM (ve své druhé generaci) měla s plnou pompou dopadnout na grafický trh s architekturou (a stejnojmennou generací) Vega. Nedopadla, to víme. Podívejme se ale nejdříve, jak situace měla či mohla vypadat:
- Vega 20 - 4× HBM2 - enthusiast
- Vega 10 - 2× HBM2 - high-end
- Vega 1x - 1× HBM2 - mainstream
- k tomu se chystaly tzv. low-cost HBM, které by s určitým časovým odstupem umožnily nasazení technologie někam na pomezí mainstreamu a low-endu, možná pro nějaká lepší APU
Jenže ač HBM druhé generace (oproti generaci první) vyráběli rovnou dva výrobci (Hynix a Samsung) a ještě se chystal třetí (Micron záhy vzdal plány s vlastním HMC a přešel na HBM), už po vydání GPU Vega 10 bylo jasné, že s ostatními produkty to dopadne bledě. Ceny totiž neklesaly a krize v paměťovém průmyslu, která srazila ceny DDR a GDDR, přiměla výrobce držet HBM cenově nahoře a z technologie, která se měla stát novým hlavním proudem, udělat high-end, aby bylo možné vydělávat alespoň na něčem.
Projekt low-cost HBM byl zrušen úplně, Vega s jedním HBM2 čipem pro mainstream se v ořezané verzi uplatnila jen jako exkluzivní produkt pro Apple (protože v klasickém PC by ji nikdo nezaplatil, s klasickými GDDR, jejichž ceny tehdy padly, bylo možné dosáhnout podstatně lepšího poměru cena / výkon) a Vega 20 už zacílila v podstatě na profi sféru, dočasné vpuštění nevelké várky čipů do konzumního segmentu bylo spíše jakýmsi „stop-gap“ nástrojem, výplní pro časové okno vzniklé určitým zpožděním první generace RDNA / Navi.
Pokud se podíváme na situaci z hlediska praktického přínosu HBM v konzumním segmentu v dnešní době, zjistíme, že od doby generace Vega velmi citelně poklesl a troufám si říct, že prakticky přestal existovat. Zatímco v době vydání Vegy stačily high-endovému řešení dva HBM čipy, dnes je (samozřejmě ve výpočetním segmentu, kde (GP)GPU HBM stále používají) standardem 6 čipů, i to přestává stačit a vypadá to, že se běžně bude osazvoat 8 čipů.
Důvodem je, že oproti historickým roadmapám běží vývoj HBM podstatně pomaleji, než se čekalo. Důvod je opět v omezení této technologie na high-end. Na produktu jsou vysoké marže, výrobce nic netlačí k zefektivnění výroby pro vyšší objemy, k zefektivnění výroby pro nižší cenu, zkrátka k žádné invenci či inovaci, která by vývoji technologie pomáhala. Růst datové propustnosti (na čip) je tak podstatně pomalejší a relativní přínos HBM oproti (G)DDR tak pomalu slábne.
Zatímco v době Vegy by produkt s výkonem >50 % top modelu bylo možné vyřešit jedním HBM čipem, dnes by široce dostupné HBM řešení (což je HBM2E) na vyřešení požadavku datové propustnosti GPU s výkonem >50 % aktuálního top modelu zdaleka nestačilo a čipy by byly zapotřebí dva.
Nedostatečnost datové propustnosti se po fiasku s HBM (z pohledu konzumního segmentu) začala řešit velkou cache poslední úrovně, kde je navíc řada možností implementace. Může být integrována přímo v čipu, může být navrstvena na čipu, může být připojena samostatnými čiplety, nebo může být integrována v podložce (interposer) či můstcích, které spojují různé čiplety. Řešení je to podstatně levnější a především podstatně flexibilnější, neboť ho lze přizpůsobit produktům pro různé segmenty. Jak demonstrovala AMD s GPU Navi 21, integrace cache o ploše několika desítek milimetrů čtverečních zvýšila efektivní propustnost pamětí na dvojnásobek s řádově nižšími náklady, než kolik by stálo dosažení stejné efektivní propustnosti s použitím HBM.
Před pár dny zveřejněná cena akcelerátoru Nvidia A800 z minulé generace (Ampere A100), $14 500 - i samotný fakt, že HBM nejsou rentabilní ani v desktopovém enthusiast segmentu, který se blíží $2000 - jasně ukázal, že v konzumním segmentu již nelze s HBM počítat. Cena by byla naprosto odtržená od reality a efektivní datová propustnost pouze na úrovni toho, čeho lze dnes snadno dosáhnout kombinací podstatně levnějších GDDR s velkou grafickou cache.