Bryan Catanzaro (Nvidia): DLSS 10 by mohlo renderovat hry kompletně přes AI
Když Nvidia uvedla DLSS (první generaci), bylo to zprvu vnímáno jako velká věc. Když však dorazily první hry a následně odpověď AMD v podobě FidelityFX CAS, který i bez AI a potřeby specifického hardwaru DLSS kvalitativně překonával, naděje a očekávání ve vztahu k AI u mnoha uživatelů poněkud ochladly. Nebylo to ani tak tím, že by FidelityFX CAS byla nějaká přelomová technologie. Spíš prostým faktem, že původní DLSS bylo vyvíjeno - jak název napovídá - jako anti-aliasing, který měl řešit zubaté hrany ve hrách, kde klasické algoritmy nefungovaly nebo stály příliš výkonu. Zvětšování obrazu byla až dodatečná myšlenka, když hry využívající ray-tracing neběhaly při plynulých FPS. Zatímco z hlediska anti-aliasingu bylo DLSS na svoji dobu poměrně dobré, z hlediska zvětšování obrazu zaostávalo za některými staršími algoritmy bez specifických nároků na hardware. Korunu celé situaci nasadily testy, ve kterých pro některé hry vycházel kvalitativně lépe i upscaling integrovaný v čipu LCD monitoru.
Podstatně zdařilejší byla druhá generace DLSS, která se už skutečně soustředila na upscaling a začala využívat časových dat (pohybových vektorů a dat z předchozích snímků). Tam se již dalo mluvit o detailech, byť tvrzení Nvidie, že detaily jsou s DLSS 2.0 kvalitnější než v nativním rozlišení, nakonec vyvrátila Nvidia sama, když při ohlášení DLSS 3.5 prohlásila, že s DLSS druhé a třetí generace chybějí některé ray-tracing efekty, které jsou v nativním rozlišení přítomny.
Třetí generace DLSS nijak zásadně neměnila základní algoritmus postavený na časových datech, ale doplnila generování snímků - na každý jeden vykreslený může DLSS 3.0 doplnit jeden vygenerovaný.
Pomineme-li zapomenutou první generaci, přineslo DLSS 2.0 možnost (v režimu „quality“) ke 100 % renderovaného obsahu doplnit 125 % obsahu generovaného (u této generace plošně; pro výstup v rozlišení 3840×2160 s DLSS 2.x je interně renderováno 2560×1440, tedy 44 % finálního rozlišení, zbylých 56 % vyrobí DLSS). S DLSS 3.0 a generování snímků je na každý snímek jeden další vygenerován. Zůstaneme-li u příkladu se 4K rozlišením, tak ke 100 % renderovaného obsahu je plošně přidáno další 125 % pixelů a následně ještě 225 % v podobě dalšího snímku. Budeme-li za 100 % považovat, co vidíme na obrazovce, pak 22 % je skutečně renderováno, 78 % generováno.
Dříve či později budou na každý snímek, jehož základ je renderován, doplněny dva snímky generované, čímž se dostaneme k poměru ~15 % renderováno, ~85 % generováno, a tak dále.
Myslím si, že řekněme takové DLSS 10 bude výhledově kompletní neurální rendering, který bude různými způsoby spolupracovat s herním enginem, díky čemuž budou hry podstatně více strhující a krásnější. --- Bryan Catanzaro, Nvidia |
Trend je tedy jasný a dalo by se očekávat, že poměr renderovaného a generovaného bude nadále zvyšován. Jenže to vypadá, že cílem Nvidie není blížit se 100 % obsahu generovaného přes AI, ale dosáhnout těchto 100 %. Vice-prezident Nvidie, který má na starost aplikované využití AI (strojového učení) totiž předpokládá, že by v nepříliš blízké budoucnosti mohla Nvidia fundamentálně změnit přístup ke grafice a klasický rendering zcela nahradit AI generováním obsahu („neurální rendering“).
Není to zajímavé jen z hlediska přístupu k akceleraci 3D grafiky, ale vlastně i ve vztahu k aktuálním trendům, kde Nvidia tlačí ve směru ray-tracingu. Ten by se však neurálním generováním obsahu stal (alespoň v klasickém pojetí) bezpředmětným, neboť by odlesky - podobně jako další části obrazu - byly generovány na základě natrénované zkušenosti.
Těžko říct, zda je zmínka o DLSS 10 odrazem nějaké interní roadmapy nebo odhadem, který vznikl v okamžiku vyřčení, ale pokud by Nvidia s verzemi postupovala podobným tempem jako doposud, pak bychom desátou generaci mohli očekávat plus mínus kolem roku 2030.