Pracovník Nvidie: Zvýšení hrubého výkonu je hloupé, Turing nejde cestou Pascalu
Víme, že Turing nezvyšuje taktovací frekvence a stejně tak víme, že Turing nezvyšuje fillrate (počet ROP je stejný jako u Pascalu). Ze základních parametrů je zvýšen aritmetický výkon (o 19-25 %) a datová propustnost paměťové sběrnice (o 27-40 % - respektive v opačném pořadí, pokud by se první údaj měl týkat GeForce RTX 2080 a druhý GeForce RTX 2080 Ti).
Jako hlavní devizu dosud Nvidia dosud Nvidia prezentovala přítomnost Tensor Cores pro akceleraci AI a Ray Tracing Cores pro ray tracing. Tyto informace dále rozvádí příspěvek pracovníka Nvidie (pixeljetstream - NVIDIA Developer Technology Engineer), který se objevil na německém diskusním fóru 3DCenter:
Hloupé zvyšování hrubého výkonu nemá budoucnost. Požadavky stoupají za hranici toho, co dokáže zajistit konvenční zlepšení procesu. Z toho důvodu jsou potřeba inovativní řešení a Turing má některé, která jsme zatím neukázali. Takové pokusy a inovace jsou, samozřejmě, na úkor velkých nárůstů výkonu v krátkodobém horizontu, ale my jsme museli sebrat kuráž a odvážit se učinit skutečný posun v dlouhodobém horizontu. Nastal správný čas. Zmenšená generace typu Pascal je uživatelsky přívětivější, ale jsem si jistý, že vývojáře osloví široká technologická výbava nového jádra. Radost budou mít i technologičtí nadšenci. |
Tato slova předávají trojí poselství. V první řadě naznačují, že ve hrách soudobého typu bude výkonnostní posun oproti Pascalu nižší než byl při vydání Pascalu oproti Maxwellu. Osobně bych v tom ale neviděl dlouhodobý trend, spíš omezení dané zvoleným 12nm výrobním procesem. Až v roce 2019 vydá Nvidia 7nm generaci, lze očekávat, že půjde o podobný styl vývoje jako mezi Maxwellem a Pascalem - výraznější posun v taktech a možná i lze počítat i s nějakým nezanedbatelným přidáním funkčních jednotek (~25 %?).
Za druhé je naznačeno, že nebylo zveřejněno vše. Nvidia již trochu naznačila zmínkou o zlepšené efektivitě i pro standardní rendering. Uvidíme, o kolik to bude.
Za třetí dochází k náznaku tradičního zavržení předchozí generace, kdy je hrubý výkonnostní nárůst symbolizovaný Pascalem označen jako něco, co nemá budoucnost, co je hloupé. Tento trend u Nvidie přetrvává poměrně dlouho a objevuje se ve vztahu k předchozím generacím bez ohledu na jejich tržní úspěšnost. Kritiku předchozí architektury bylo možné zaznamenat ve vztahu k GeForce FX (NV30) při vydání GeForce 6000 (NV40), dále ve vztahu k GeForce 7000 (G70) při vydání GeForce 8000 (G80), poté ve vztahu k GeForce 200 (GT200 / Tesla) při vydání GeForce 600 (GK104 / Kepler) a nyní při vydání GeForce 2000 (TU104 / TU102) ve vztahu ke generaci Pascal.
Vyjádření o nižším nárůstu výkonu v aktuálních aplikacích vlastně vysvětluje, proč Nvidia poprvé vydává GeForce xx80 Ti zároveň s GeForce xx80. U předchozích generací byla vždy mezi uvedením produktu na velkém jádru „102“ a základního na jádru „104“ výrazná časová prodleva. Tu nyní výrobce eliminoval. Důvodem může být obava z nižšího výkonnostního posunu jádra TU104 oproti nejvýkonnějším modelům současné generace. Připomeňme, že GeForce GTX 1080 (GP104) při svém uvedení výrazně výkonnostně překonávala veškeré produkty předchozí generace (GeForce GTX 980 téměř o dvě třetiny, GeForce GTX 980 Ti téměř o třetinu). Tento vztah novinky k předchůdcům u nové generace patrně nebude samozřejmostí, proto rovnou došlo i na výkonnější TU102 / GeForce RTX 2080 Ti.