AMD investuje do multi-čip technologií a křemíkových podložek (+historie)
AMD, respektive ještě samostatná ATi, se technologiím MCM - multi-chip-module - věnovala už na přelomu tisíciletí. Tehdy samozřejmě šlo o produkty na trochu jiné úrovni, ale jejich odkaz je patrný doposud. Situaci si můžeme stručně (no, vysloveně stručné to nakonec není) zrekapitulovat. Pomineme-li úplně nejstarší experimenty, které předcházely prvnímu produktu, dá se právě za první prezentaci funkčního řešení považovat jedna z variant Radeonu 9700 Mobility s integrovanou pamětí:
Radeon 9700 Mobility, přelom let 2003 / 2004
Tehdy šlo o GPU RV350, na jehož pouzdře byly umístěné GDDR paměti v podstatě standardním BGA pouzdru. Výhodou byla úspora místa na PCB. Myšlenka tohoto řešení je využívána doposud, jen už tento koncept není využívaný v mobilním segmentu, ale v embedded segmentu.
jeden z embedded Radeonů, E8860, přelom roku 2013 / 2014
Důvodů je několik. Průměrná šířka paměťové sběrnice stoupla, průměrný počet paměťových čipů osazený na grafické kartě stoupl, průměrná spotřeba grafických jader stoupla, průměrná plocha grafických jader stoupla a dnes již zkrátka není možné, aby se na pouzdro nadprůměrně výkonného grafického čipu vešlo tolik paměťových čipů, kolik odpovídá aktuálním standardům. U výkonnějších grafik by pak pouzdrům BGA pamětí nedělaly dobře vysoké teploty jádra. Koncept se proto dostal do embedded segmentu, kde jsou nároky na kapacitu paměti nižší a kde tato MCM staví na menších grafických čipech.
mechanický vzorek procesoru s DDR3 na společné podložce (interposer), 2007
Vývoj pro desktopová a mobilní řešení tedy pokračoval jiným směrem. Co vidíte na 11 let starém snímku výše, není sice GPU, ale jde o bod, kdy se odklonila nová evoluční větev, která pro spojení čipů začala využívat podložku, interposer. Důvod byl prostý. Paměti v BGA pouzdře už byly z výše popsaných důvodů nepoužitelné. Pouzdro, jehož rozměry byly dané hrubým BGA rozhraním, bylo příliš velké a zabíralo příliš místa. Bez BGA rozhraní ale zase nelze paměti připojit přímo k substrátu, protože ten není na připojení jejich jemného rozhraní dimenzovaný. Byla tedy implementována podložka, která zvládala propojit jemné spoje přímo z křemíku, čímž padla potřeba přítomnosti klasických BGA pouzder, která v podstatě fungovala jako určitá redukce z jemného rozhraní na hrubé (zjednodušeně řečeno).
RV635 s GDDR5 na společné podložce, tehdy však ještě ne křemíkové, ale organické
Výše už vidíte vzorek GPU využívající podložky (interposer) k připojení pamětí. Jde o jádro RV635 (v desktopu zvané Radeon HD 3650). V té době byla řeč ještě o grafické kartě ATI, nicméně již jako grafické divizi AMD. Vzorek kombinuje čip nižšího mainstreamu s GDDR3 pamětmi. Ačkoli vzorků vznikly řádově stovky, do sériové výroby se nic podobného nedostalo, nebyl důvod. Pro relativně malý čip stačil starší koncept s BGA pouzdry a v podstatě žádnou uživatelskou výhodu toto řešení ještě nenabízelo.
GPU architektury Cypress (345 mm²) na křemíkové podložce (500 mm²),
vpravo dole vyvedeno rozhraní pro paměti v konfiguraci daisy-chain (řetězení)
cca 2011-2012
Roku 2009 vydala AMD ATI Radeon HD 5870 s jádrem Cypress. Po jistou dobu šlo o nejvýkonnější GPU na trhu, ale z pohledu dnešního tématu se stalo zajímavým až o pár let později, kdy na zbývajících skladových zásobách začala AMD experimentovat s novinkou - využitím křemíkového interposeru. Výsledek vidíte výše. Proč došlo k náhradě organického substrátu křemíkem? Proto, že spoje křemík-křemík umožňuje implementaci ještě jemnějšího rozhraní, tedy širší sběrnice. Tím pádem oproti nejstaršímu řešení s BGA paměti na pouzdru čipu i oproti organickému substrátu nabízí tento koncept konkrétní výhodu. Jemnější rozhraní umožňuje snížit plochu křemíku (grafického čipu) věnovanou rozhraní paměťové sběrnice, dále umožňuje implementovat širší sběrnici a z toho vyplývá možnost vyšší paměťové propustnosti a níže taktovaného paměťového rozhraní, což snižuje energetické nároky.
experimentální GPU generace GCN (502 mm²) osazené na křemíkové podložce (818 mm²)
přelom let 2013 / 2014
Zatímco v případě vzorku s jádrem Cypress šlo pouze o experimentální využití křemíkové podložky s tím, že výše vyjmenované výhody zůstávaly na teoretické úrovni (Cypress měl danou 256bit sběrnici pro GDDR5 a tím možnosti začínaly i končily), další vzorek již těchto možností využíval. Nesl GPU, které již nebylo vybavené (G)DDR rozhraním, ale jemnějším a širším paměťovým rozhraním určeným k připojení ke křemíkové podložce a to bylo doplněné speciálně navrženými pamětmi - vzorky technologie, která dostala označení HBM, high-bandwidth memory. Aby plocha křemíkové podložky mohla být co nejnižší, vyvinula AMD se společností Hynix vrstvené paměti HBM, kdy je 2-8 křemíkovým paměťových čipů navrstvených na sobě, čímž jsou dále redukovány plošné požadavky výsledných paměťových čipů (či, dá se říct, modulů).
vzorek GPU Fiji (592 mm²) na křemíkové podložce (1011 mm²) s čtyřmi HBM pamětmi
Předchozí vzorek - vyzkoušením křemíkové podložky o ploše přesahující standardní limit mřížky výrobního procesu (reticle limit) v kombinaci s větším GPU - ověřil možnosti výroby prvního finálního produktu, kterým se stalo GPU Fiji (výše) a na něm postavené Radeony řady Fury. Samozřejmě i jeho sériové výrobě předcházely vzorky (což je i čip na snímku). Oproti předchozímu experimentálnímu GPU byly ještě řešeny dílčí problémy a mj. náklady, což zahrnovalo i co nejvhodnější kombinaci rozměrů GPU, aby křemíková podložka mohla být co nejmenší a zbytečně nezvyšovala cenu.
jádro Vega 10 (484 mm²) se dvěma pamětmi HBM druhé generace na křemíkové podložce
(údaj o ploše nemám, odhaduji cca 760 mm²)
Druhým produktem se stalo jádro Vega 10, které snižuje výrobní náklady. Toho dosahuje kombinací 14nm výroby, která snižuje plochu jádra a použitím druhé generace HBM pamětí, která díky dvojnásobné přenosové rychlosti umožňuje redukovat šířku sběrnice a tím i počet čipů na polovinu. V důsledku toho výrazně klesají nároky na plochu křemíkové podložky.
ilustrace GPU Vega 11 (odhadem 240 mm²) s jednou pamětí HBM druhé generace,
plocha podložky by mohla být kolem 400 mm²
Třetím produktem AMD s touto technologií se stane jádro Vega 11, jehož podoba byla navržena podle požadavků mobilního trhu. I to přináší jednu novinku a to snížení výšky pouzdra. Zatímco Vega 10 má pouzdro vysoké 3,42 mm, pouzdro mobilní Vegy 11 je na výšku méně než poloviční, pouze 1,7 mm vysoké. AMD tím dokázala s technologií křemíkové podložky dosáhnout stejně nízké konstrukce, jako Intel využívající na Kaby Lake-G technologii EMIB (křemíkový můstek). Intel jako jednu ze zásadních výhod EMIB uváděl nižší konstrukci. To se ale AMD podařilo obratem vyvrátit.
Podstatnější změna je očekávána s nástupem architektury Navi. AMD je velmi opatrná ve svých vyjádřeních, ale patenty společnosti a některé údaje ve starších roadmapách naznačují, že další krok bude spočívat v rozdělení GPU na několik částí umístěných vedle sebe. Důvodem takového řešení je zvýšení výtěžnosti a možnost využití nových výrobních procesů v době, kdy by výroba monolitického řešení byla nerentabilní. Prozatím jde ovšem o neoficiální informace a spekulace, byť postavené na základě skutečných údajů.
Určitým vodítkem mohou být aktuální vyjádření CEO AMD Lisy Su na toto téma:
„Aniž bych komentovala konkrétně technologii EMIB [křemíkové můstky, které aktuálně využívá Intel na Kaby Lake-G], co bych řekla, je, že řešíme všechny formy multi-čipových technologií. Myslím, že interposer [křemíková podložka] je ten, který používáme nyní, široce a v [sériové] výrobě, ale zároveň investujeme ohromné prostředky do výzkumu možných propojení čipů; uvidíte, že toho v tomto směru uděláme více, budeme pokračovat v investicích […] Mnoho [z těchto výzkumů] provádíme ve spolupráci, velmi mnoho. Myslím, že jde o záležitost, ve které budeme [dále] spolupracovat s výrobními partnery; budeme pracovat s OSATS [objective structured assessment of technical skills], ale v našem případě půjde o extrémní způsoby využití nebo agresivní způsoby využití. Důsledkem toho je, myslím, že partneři mají zájem o spolupráci s námi, protože můžeme být technologickým leaderem v tomto odvětví.“ |
Nezdá se tedy, že by AMD plánovala na stávajícím směru něco měnit, spíše naopak. Rozdělení monolitických GPU na menší jádra je tedy jasný směr a jestli k němu fakticky dojde s generací Navi nebo až s jejím nástupcem („Next-Gen 7nm“), na definovaném cíli nic nezmění.
Zatímco technologii propojení má AMD hotovou a reálně implementovanou ve 2-3 produktech, v případě rozdělení samotného GPU už nepůjde jen o opětovné využití této technologie v rámci nového produktu. Budou potřeba i určité architektonické změny, se kterými začala již generace Vega. Jejich společným jmenovatelem bude zajistit, aby se GPU rozdělené na dva či více čipů z hlediska aplikací chovalo jako jeden monolit a zároveň fungovalo přiměřeně efektivně, což bude vyžadovat investice jak do architektonických úprav, tak do ovladačů. Alespoň jednou pozitivní zprávou v tomto směru je, že tyto investice si společnost za stávající finanční situace již může dovolit.
prezentace AMD, Anandtech