Sony přiblížila GPU Playstation 4 Pro, jde o „GCN 4.5“, Polaris s prvky Vegy
O grafickém jádru Playstation 4 Pro alias Playstation 4 Neo již Sony něco málo prozradila, ale útržkovité informace vyvolaly více otázek, než kolik jich zodpověděly. Podstatou původního sdělení bylo, že GPU má prvky architektury Polaris, ale v některých ohledech ji překonává. Ve světle specifikací jádra původního Playstation 4 bylo jasné, že se tím mnoho nedozvídáme. To totiž neslo prvky architektury GCN 1, GCN 2 (některými weby tehdy označované jako GCN 1.1), ale zároveň disponovalo zjednodušenými ROP, které v základních rysech nápadně připomínaly generaci VLIW-4, respektive Radeony HD 6900.
Pokud jde o jádro nové Playstation 4 Neo, pak se zdá, že toto za Polaris / GCN 4 nejde, tedy že nepřebírá prvky jejích předchůdců, pouze jejích následovníků - generace Vega. Pracovně bychom ho tedy mohli nazývat „GCN 4.5“.
Co konkrétně přesahuje možnosti Polaris / GCN 4: Jádro Playstation 4 Neo umí pracovat s výpočty s přesností FP16 (half-precision) 2× rychleji než ve standardní přesnosti. Podobně jako Vega nebo například Pascal P100 od Nvidie. Jaké využití bude mít tento prvek u herního zařízení, zatím není jasné. Vývojáři ale mají možnost tohoto prvku využít a pokud některé dílčí výpočty nebudou vyžadovat vyšší přesnost, pak poběží až 2× rychleji. Zatímco špičkový výkon v FP32 dosahuje 4,2 TFLOPS, v FP16 se zvyšuje na 8,4 TFLOPS.
Další změny už spolu více či méně souvisejí. V první řadě jde o zvýšení teselačního výkonu, které je dle slov Cerneho „dost dramatické“. Dále hovoří o velmi pokročilém systému rozdělení úloh mezi různé výpočetní bloky, což by v tomto kontextu mohlo zahrnovat i geometrii distribuovanou na úroveň jednotlivých výpočetních bloků. Zmiňuje také akcelerátor renderingu scén, které obsahují velké množství drobných objektů. Systém rozdělení výpočtů je prý velmi komplexní a zajišťuje, že i zpracování malých objektů může být inteligentně rozloženo mezi větší množství výpočetních bloků.
Tento soubor technologií, který má za úkol efektivně rozdělit zpracování scény mezi různé výpočetní bloky, otevřel novou vlnu spekulací. A to, zda nejde o předvoj technologie, která by dokázala inteligentně rozdělovat zpracování scény mezi několika grafickými čipy. Raja Koduri, šéf Radeon Technologies Group, totiž při jedné příležitosti zmínil, že budoucnost vidí ve větším počtu menších čipů než v realizaci větších a větších monolitů. Pro efektivní spolupráci více čipů je ale třeba nějakým elegantním způsobem vyřešit sloučení jejich výkonu pro vykreslování jedné scény. V současnosti CrossFire a SLI používá primárně režim AFR, prosté střídání jednotlivých čipů po snímku. To s sebou nese určité výhody (ideální rozložení zátěže, násobení geometrického výkonu), ale také řadu úskalí: problematická synchronizace, problematická kompatibilita s některými enginy, potřeba speciální podpory v ovladačích pro jednotlivé aplikace. Alternativu nabízí API Vulkan a DirectX 12, která dávají herním vývojářům do ruky nástroj, s jehož pomocí mohou jednotlivá GPU využít vlastním způsobem. To může vést ke snížení latencí a odstranění potíží se synchronizací, ale nárůsty výkonu bývají nižší a hlavně je vyžadována podpora ze strany aplikace, což je de facto práce navíc ze strany vývojáře. Efektivní nasazení více grafických čipů proto vyžaduje vlastní systém řízení, který dokáže automaticky nebo alespoň poloautomaticky rozdělovat zátěž mezi jednotlivé čipy a to bez ohledu na podporu ze strany aplikace. Právě architektonické změny na úrovni jádra Playstation 4 Neo by mohly být prvním krůčkem tímto směrem.
Nakonec Cerny zmínil přítomnost bufferu, který umožňuje zaznamenávat data o vzájemné pozici konkrétních polygonů a pixelů (paralelně se Z-bufferem). V tomto případě ale není známo, k čemu by tato funkce mohla být herní konzoli nebo budoucím produktům prospěšná.