Budou 14/16nm GPU nadlouho poslední velkou událostí v grafice?
Nvidia Pascal GP104 a GP106, AMD Polaris 10 a 11, výhledově následované Pascalem GP102 a Vegou 10. To je veřejně známý harmonogram nástupu 14/16nm generace produktů, na kterou se čekalo… vlastně už od Vánoc 2011, kdy se objevily recenze prvního 28nm GPU. Pokud dobře počítám, protáhl se interval přechodu na nový výrobní proces na (bez půl roku) pět let.
Možná už vám to ani nepřijde divné, ale stačí trochu zavzpomínat a vyvstane zajímavý kontrast. Tak třeba duben 2007. Co se tehdy dělo? Na trhu byla už několik měsíců GeForce 8800 GTX od Nvidie s jádrem G80 vyráběným na 90nm procesu. A právě v polovině zmíněného měsíce ji doplnila GeForce 8600 GTS s jádrem G84 vyrobeným na 65nm procesu. Netrvalo to ani měsíc, dorazil zpožděný Radeon HD 2900 XT od ATI/AMD (tehdy již jedné firmy, ale stále používající značku ATI) s jádrem R600 vzniklým na 80nm procesu. S přelomem konce školního roku a prázdnin pak i ATI přidala Radeon HD 2600 XT s 65nm procesem a dva měsíce poté, co se žáci a studenti vrátili do lavic, následoval Radeon HD 3870 s 55nm jádrem RV670. Přes zimu záplava nových procesů ustala, ale hned na jaře představil 40nm generaci Radeon HD 4770 s GPU RV740.
Shrnuto podtrženo, za jediný rok se v high-endu a mainstreamu vystřídalo 5 výrobních procesů a nikomu to nepřišlo zvláštní. Popravdě ale bylo, toto období přineslo vůbec nejvyšší kadenci v nasazování nových procesů v historii grafických karet. Tři roky ale stačily na to, aby se z cyklu 5 procesů za 1 rok stal 1 proces za (téměř) 5 let. Tato změna, navíc prošpikovaná odpadáním některých technologií jakožto nepoužitelných či téměř nepoužitelných pro větší grafické čipy (20nm) nepřinesla pouze úbytek nových produktů, ale velmi výrazně změnila grafický trh.
ATI/AMD se dlouhodobě držela strategie rychlé adaptace výrobních procesů, což sice znamenalo financování špičkového týmu specialistů pro implementaci návrhů do výrobních procesů, ale to jí zajišťovalo několikaměsíční náskok v použití nových technologií. Mohla si dovolit vyšší rozpočet tranzistorů, vyšší spotřebu umravnilo použití o (půl)generaci lepšího procesu a to v nejednom případě vyústilo i v nižší nároky na chlazení grafické karty. Tato strategie fungovala poměrně spolehlivě - stála ovšem na jednom předpokladu a to, že TSMC každý rok zpřístupní alespoň 1-2 nové výrobní procesy. Pokud každých několik měsíců přijde nový proces a vy máte s adaptací nového procesu také náskok několik měsíců, je úspěch zaručen. Podobná strategie ovšem nemůže fungovat v okamžiku, kdy se na trhu 5 let drží jediný proces. V takové situaci je tříměsíční náskok, který AMD předvedla ještě s prvními 28nm produkty, jen velmi dočasnou výhodou.
Nvidia si naproti tomu včas uvědomila, že se intervaly mezi novými procesy nejen neúměrně prodlužují, ale také že zdaleka ne každý nový proces bude vhodný pro výrobu (velkých) grafických čipů. To už bylo důsledkem orientace křemíkového průmyslu na mobilní boom odstartovaný Applem, kdy se pozornost TSMC a dalších firem stočila od grafických čipů k malým mobilním ARM SoC. Nvidii se podařilo odhadnout dříve než AMD, že 20nm výroba nevyřeší to, co výkon 28nm generace limituje nejvíce: spotřebu. Už s první generací grafických karet pro 28nm proces narazili oba výrobci na limit 250W TDP, který sice není tesaný do kamene, ale jehož překročení bylo mnohdy hodnoceno s pejorativním nádechem.
Zatímco AMD se s první generací 28nm produktů soustředila na architekturu (GCN 1), díky níž by jí konkurence nenachytala na švestkách ani s ohledem na výkon, ani s ohledem na technologie, ani s ohledem na kvalitu obrazu a ani s ohledem na výpočetní výkon, Nvidia se naopak soustředila na experimentování v oblasti snižování spotřeby. To jí sice právě na první 28nm generaci (Kepler) nepřineslo nijak citelnou strategickou výhodu; získala tím zkušenosti pro vývoj další generace (Maxwell), která spotřebu snížila (či energetickou efektivitu zvýšila) nezanedbatelnou měrou.
Právě spotřeba limitující výkon pozdějších 28nm produktů AMD v kombinaci s chybějícími financemi, které omezily kadenci nových produktů, vedly ke strmému poklesu tržního podílu. I když se zdá, že s generací Polaris AMD energetickou stránku vrátí na konkurenceschopnou úroveň, získání původního tržního podílu bude běh na dlouhou trať. Významnou měrou bude záležet na to, jak se podaří odhadnout další vývoj na poli výrobních procesů a přizpůsobit se mu.
Pro tuto chvíli je jasné, že nás na 14/16nm procesech čekají přinejmenším 2-3 generace hardwaru. Může jich být nakonec i víc. Následující 10nm proces je totiž ve své podstatě jen optickým zmenšením 14/16nm procesu. Ani na straně TSMC ani na straně Samsungu nepřináší žádné nové technologie, které by měly redukovat spotřebu jiným způsobem než zmenšením struktur, jako tomu bylo při přechodu z 28 nanometrů na nechvalně známých 20. Ve prospěch přechodu 14/16->10 nanometrů hraje fakt, že leakage 14/16nm procesů byla poměrně výrazně snížená, zatímco u 28nm výroby oproti předešlé generaci nijak výrazně nepoklesla. Přestože je potenciál 10nm procesu pro výrobu grafických čipů vhodnější než potenciál 20nm procesu, spojuje obě generace několik paralel, které je předurčují spíš mobilnímu segmentu.
Zatímco u 10nm procesu (který nepřinese zdaleka takový skok jako 14/16nm z 28nm) se výrobci předhánějí především v tom, kdo jej nabídne dřív a čí přinese vyšší denzitu (menší čipy), se 7 nanometry bude situace opačná. Zde se očekávají výraznější technologické změny. Intel avizoval, že už nezůstane (jen?) u křemíku, ostatní výrobci se ještě pokusí na křemíku zůstat a vydojit, co půjde. Obě cesty jsou ale během na dlouhou trať a to s poměrně nejistým výsledkem. Nebylo by nijak překvapivé, kdyby ještě v roce 2020 nebo později vycházely nové modely grafických karet vycházející stále z 14/16nm grafických čipů.