Hynix a Samsung pracují na Extreme HBM(3) i nízkonákladových HBM
Výrobci pamětí už v začátcích technologie HBM vnesli do značení menší zmatek, když se rozhodli nerespektovat názvosloví JEDEC a zavedli si zkratku HBM2, která nemá ve specifikacích oporu. Pro zachování duševního zdraví našich čtenářů ale přinejmenším protentokrát u zkratky HBM2 zůstaneme. Neustálé popisování technologie včetně rozdílů oproti specifikacím JEDEC, které by vysvětlovalo, o jaké verzi modulů právě mluvíme, by totiž přehledu značně ubralo na přehlednosti.
Pro úvod tedy postačí, když si zrekapitulujeme, že HBM je technologie vrstvených pamětí, jejímž cílem bylo výrazně zmenšit nároky paměťového rozhraní na křemík i energii prostřednictvím výrazného rozšíření sběrnice v kombinaci s rozhraním vyvedeným z čipu prostřednictvím technologie TSV (through-silicon vias). To umožňuje, oproti klasickému rozhraní vyvedenému jen po obvodu čipu, vměstnat na malý prostor několikanásobně vyšší množství kontaktů. Díky velmi široké sběrnici pak paměť i rozhraní může běžet na mnohem nižších taktech a šetřit energii.
První generace produktů HBM nabídla přenosovou rychlost 128 GB/s pro každý čip (efektivní takt 1 GHz), HBM2 toto zvýšila na až 256 GB/s pro každý čip (efektivní takt až 2 GHz) a derivát TSV pamětí nazvaný Wide I/O2 (který počítá s nižším počtem vrstev, užší šířkou pásma a efektivními takty do 1066 MHz) dosahuje až 68 GB/s, což je více než dost pro mobilní zařízení jako jsou high-endové chytré telefony nebo tablety.
Na letošní akci Hot Chips se výrobci pamětí Samsung a Hynix rozpovídali o dalším vývoji na poli technologie HBM. Obě společnosti pracují na nástupci HBM2, kterého prozatím označují jako „xHBM“ nebo „Extreme HBM“ (Samsung), případně „HBMx“ či „HBM3“ (Hynix). Nová generace by měla přinést nejen očekávatelné zvýšení datové propustnosti a energetické efektivity, ale více se zaměřit i na výrobní náklady, které omezovaly použitelnost dosavadních řešení na high-end segment. Přestože zatím nebyly specifikace uzavřené, patří k základním cílům HBM3 zdvojnásobit datovou propustnost na čip (tzn. dosáhnout 512 GB/s) a s ohledem na tuto datovou propustnost nabídnout dostupnější ceny.
Co to bude znamenat v praxi? Grafická karta se čtyřmi čipy HBM3 by disponovala datovou propustností 2048 GB/s (Radeon Fury X se čtyřmi HBM dosahuje 512 GB/s), případně by datové propustnosti Radeonu Fury X mělo být dosažitelné s použitím pouhého jednoho čipu HBM3, což ušetří jak křemík na straně paměťového rozhraní GPU, tak na straně křemíkové podložky (interposer), která spojení GPU a pamětí realizuje.
Samsung dále připravuje tzv. „low-cost HBM“. Nepůjde o výprodej původních HBM za zvýhodněné ceny, jak by se možná zprvu mohlo zdát, ale o odlišně koncipované řešení. Klasické HBM i HBM2 disponují v praxi 1024bit širokým rozhraním. HBM2 zvyšují datovou propustnost 2× vyššími efektivními takty. Náklady na paměti i rozhraní v čipu se ale odvíjejí (mimo jiné) od šířky rozhraní, takže HBM2 nezvyšují ekonomickou efektivitu jinak než možností použít poloviční množství čipů pro dosažení stejné datové propustnosti s původními HBM. Samsung se proto rozhodl přijít s variantou, která se více zaměří na ekonomickou stránku. Tato konfigurace zužuje šířku rozhraní zhruba na polovinu (512bit), ale zároveň zvyšuje efektivní takt o zhruba 50 % oproti HBM2, tzn. ze 2GHz na ~3GHz.
Zatímco s jedním čipem HBM2 lze dosáhnout datové propustnosti až 256 GB/s, cílem Samsungu pro „low-cost HBM“ by bylo dosáhnout zhruba 200 GB/s (pokud bychom prostě vynásobili šířku rozhraní 512bit s efektivním taktem 3GHz, vycházelo by nám 192 GB/s). Takový výsledek vůbec není špatný. Označení „low-cost HBM“ (nikoli „low-cost HBM2“) navíc indikuje, že by se cena takového produktu měla blížit spíše původním HBM než dražším HBM2, což při dosažení 75 % jejich datové propustnosti (byť asi trochu na úkor spotřeby z důvodu vyšších taktů) může být dalším krokem k nástupu technologie HBM do mainstreamového segmentu.
Na akci byl přítomný také Micron; jeho produkty ale do světa grafických karet patrně zasahovat nebudou. Hovořil hlavně o DDR5 a HMC. DDR5 (nikoli GDDR5) jakožto nástupci DDR4, jejichž hlavním cílem budou systémové paměti (RAM). Cílem DDR5 je zdvojnásobení datové propustnosti oproti DDR4 (efektivní takt 3200-6400 MHz). Vzorky by měly být připravené v roce 2018 a start výroby očekává Micron v roce 2019. Reálný nástup do světa PC vidíme nejdříve na rok 2020.
Prezentace Micronu nicméně pokračovala v poměrně arogantním duchu, společnost ji postavila na kritice konkurenční HBM, kterou nazývala „špatnou kopií HMC“. Je pravdou, že HMC disponuje několika technologiemi cílenými na serverový segment, které HBM nenabízí - podobná arogance nicméně není na místě. Reálný produkt s HBM pamětmi je na trhu od poloviny roku 2015, letos došlo k uvedení grafické karty s HBM2, kdy nový standard přijal další výrobce, přičemž - ač Micron mluví o druhé generaci vlastních HMC - nepodařilo se mu dosud dostat ani první generaci HMC mimo portfolio Intelu, se kterým tento standard vyvíjel.
Ačkoli Micron nenechal na HBM nit suchou, zůstává faktem, že reálně dostupné HMC moduly zaostávají za reálně dostupnými HBM moduly ve všech základních ukazatelích: v datové propustnosti, v energetické efektivitě i v poměru cena / datová propustnost. Srovnání, která dopadají příznivě pro Micron, buďto vycházejí z porovnání budoucích variant HMC s komerčně dostupnými modely HBM, nebo ze srovnání specifických vlastností, které dokážou docenit jen zákazníci velmi specifického tržního segmentu. Je s podivem, že společnost jako Micron má podobný styl prezentace produktů zapotřebí. Lze to chápat i jako indikaci zoufalé snahy o prosazení technologie, která během svého vývoje nabrala obrovský skluz, nedokázala dosáhnout původně vytyčených cílů (jak časových, tak vstupu na trh grafických karet) a stála společnost obrovské množství času a financí.
Pokud se neřadíte k pamětníkům, vězte, že technologii HMC uvedl Micron již v létě 2011. Hybrid Memory Cube Consortium zahrnovalo i společnosti jako Samsung nebo Hynix. Po letech odkladů a nesplněných cílů se ale Hynix odklonil a společně s AMD připravil vlastní technologii HBM, kterou oproti Micronu dokázal bez odkladů uvést na trh dříve, než Micron o více než dva roky starší HMC. K Hynixu se následně připojil i Samsung. Paměti typu HBM využívá AMD na Radeonech Fury a Nvidia na generaci Pascal s jádrem GP100.