Diit.cz - Novinky a informace o hardware, software a internetu

Jak je to s výkonem GeForce RTX 4090 a s kvalitou DLSS 3.0

CEO Nvidie Jen-Hsun Huang odhalil GeForce RTX 4090 a celá jeho prezentace byla postupně podrobena podrobnému zkoumání uživatelů a tisku. Některá zjištění stojí za pozornost…

Je výkon finální, nebo si Nvidia nechává rezervu?

Nvidia zveřejnila mimo jiné níže uvedený výkonnostní graf, který jste mohli vidět v našem článku po oficiální akci. Graf vyvolal jistou kritiku poukazující na jeho nepřehlednost, jako je míchání výkonu s DLSS a bez DLSS, míchání vydaných a nevydaných her (nebo jejich nevydaných verzí) a podobně. Konstatování Nvidie, že DLSS a raytracing byly použité, kde to bylo možné, nedává uživateli jednoznačnou odpověď, kde a co bylo použité, neboť u nevydaných her / buildů není jasné, zda ve verzi, kterou Nvidia testovala, je možné DLSS či raytracing zapnout. 

S určitou jistotou lze říct, že ani jedno nebylo použito u první trojice her: Resident Evil Village, Assassin's Creed Valhalla a The Division 2. Zde tedy zcela jistě hodnotíme nárůst výkonu hardwaru, nikoli vliv nové verze DLSS 3.0 schopné mimo jiné na každý vykreslený snímek doplnit jeden „vymyšlený“ umělou inteligencí.

V této trojici her dosahuje GeForce RTX 4090 v průměru o 57 % vyššího výkonu než GeForce RTX 3090 Ti (což by odpovídalo asi 72-73 % výkonu nad GeForce RTX 3090). Ozývají se tak otázky, proč je čip s 2,7× vyšším rozpočtem tranzistorů (76,3 miliardy oproti 28,3 miliardy) v kombinaci s o polovinu vyšší taktovací frekvencí (2520 MHz vs. 1695 MHz) a 16× větší L2 cache (96 MB vs. 6 MB) jen o 73 % rychlejší.

Objevují se v podstatě tři typy názorů či vysvětlení. První vychází z hypotézy, že si Nvidia nechává prostor a navzdory oficiálnímu ohlášení nechce vyložit všechny karty. Záměrně tudíž vybrala hry, kde je mezigenerační posun podprůměrný. Aby údaji o vysokém výkonu nepřiměla AMD k finální úpravě specifikací zvyšujících výkon (např. vyšší takty, vyšší TDP, vyšší počty aktivních stream-procesorů na ořezaných modelech).

Druhé je v podstatě podobné a vychází ze zpráv, podle kterých lze GeForce RTX 4090 přepnout z výchozího režimu s 450W TDP do režimu s 600W TDP, kdy dosahuje podstatně vyššího výkonu. V tomto případě jsou výsledky naměřené na 450W TDP a překvapením má být výkon na 600W.

Třetí nepočítá s žádným překvapením a očekává, že výkon bude skutečně takový, jaký vidíme v grafu. Rozpočet tranzistorů v tom případě padl především na vylepšování RT-cores (raytracing) a Tensor Cores (akcelerace AI). I v takovém případě by ale z podstaty nárůstu aritmetického a texturovacího výkonu měl být celkový posun herních FPS vyšší. To je pak vysvětlováno případným limitem. Na tom, co by mělo výkon limitovat, nepanuje shoda. Objevují se názory (či možnosti), že datová propustnost, TDP (tím bychom ale dávali značný prostor hypotéze číslo 2) nebo prostě nějaký nám neznámý architektonický prvek.

Bez ohledu na to, co by bylo oním důvodem, by to znamenalo, že poměr herních FPS na jednotku teoretického výkonu (aritmetického, texturovacího) klesl. Zde se pak objevují otázky, zda by situace neměla být opačná s ohledem na Shader Execution Reordering, který má zvyšovat efektivitu využití aritmetických jednotek. Je však potřeba mít na paměti, dvě skutečnosti:

Za prvé podstatu této technologie používá i Intel na grafických čipech Arc (pod názvem Thread Sorting) a nelze říct, že by to samo o sobě stačilo k dosažení efektivity či výkonu nad úroveň současných konkurenčních produktů, které Shader Execution Reordering (Thread Sorting) nepodporují. Dále pak vše nasvědčuje tomu, že Shader Execution Reordering (podobně jako Threadr Sorting) je podporovaný pouze na úrovni RT-Cores. Jinými slovy slouží pouze pro raytracing.

Celé třetí vysvětlení by pak znamenalo, že Nvidia odsouvá klasickou rasterizaci ne na druhou, ale na „hodně vedlejší“ kolej a v podstatě jí nezáleží na tom, jakého výkonu budou GPU ve hrách bez raytracingu / DLSS 3.0 dosahovat. Ani tato možnost, ač překvapivá, nemusí být nereálná, neboť pro ni existuje precedens. Když Nvidia vydala výpočetní GPU Ampere A100:

Tehdy totiž prakticky přestala řešit standardní (vektorový) výpočetní výkon a většina tranzistorů padla na zvyšování výkonu a podporu formátů maticových operací (Tensor Cores, AI), které Nvidia považovala za důležitější. Dlužno dodat, že minimálním posunem výkonu v double-precision i v běžné výpočetní zátěži tím naservírovala část trhu AMD, která tak dostala prostor k návratu na trh s výpočetními akcelerátory. Asi není potřeba zdůrazňovat, že díky akcelerátorům Instinct dokázala AMD příležitost rychle využít.


Kvalita DLSS 3.0

DLSS 3.0 přináší jednu zásadní novinku a to, že krom klasického postupu, kdy získává FPS interním renderingem v nižším rozlišení a zvětšováním (rekonstrukcí) snímků na rozlišení žádané, přináší ještě generování celých snímků prostřednictvím AI („Frame Generation“). Na každý reálně vykreslený (+zvětšený snímek) je s použitím AI a vektorů pohybu vygenerován (vymyšlen) další snímek. Z dosavadních útržkovitých údajů se zdá, že to nebude automaticky znamenat zdvojnásobení FPS oproti DLSS 2.0, neboť proces generování nových snímků taky nějaký (a asi nezanedbatelný) výkon stojí.

Každopádně jak ukázalo samotné oficiální video Nvidie, snímky vygenerované s DLSS 3.0 dosahují podstatně horší kvality než snímky vyrenderované a (pouze) zvětšené. Pokud se ve videu posouváte po jednotlivých snímcích, snadno poznátek, které snímky byly vykreslené a které vymyšlené. I na zmenšeninách je vidět, že pohybující se objekty jsou v každém druhém snímku neostré, zdvojené, rozmazané ap.:

Vlevo jen vykreslené snímky, vpravo s DLSS 3.0 Frame Generation.
Nahoře vpravo lichý (vykreslený) snímek, dole vpravo sudý (vymyšlený) snímek.
Pro plné rozlišení otevřete v novém panelu/okně a rozklikněte.

Výsledek tak připomíná funkce kdysi propagované výrobci televizorů, kdy měl být procesor televize schopný z 24/25/30FPS videa rekonstrukcí vytvořit plynulejší 60FPS video odpovídající obnovovací frekvenci obrazovky. Výsledky byly mnohdy pochybné vizuální kvality. Na ukázce výše bude zásadním problémem to, že se střídají ostré a rozmazané snímky, takže při nižších FPS nelze vyloučit vizuálně rušivý výsledek. Nezbývá tedy doufat, že se do říjnového vydání podaří Nvidii tyto nedostatky doladit. Prozatím však nelze vyloučit ani možnost, že Nvidia toto považuje za finální stav a lepšího zatím není schopna dosáhnout.

Diskuse ke článku Jak je to s výkonem GeForce RTX 4090 a s kvalitou DLSS 3.0

Sobota, 24 Září 2022 - 06:09 | Kutil | To odpovídá přestavbě vnitřní struktury. A...
Sobota, 24 Září 2022 - 06:07 | Kutil | Když si spočítáte jen základní rozdíly výkonu v...
Sobota, 24 Září 2022 - 06:00 | Kutil | Ale do budoucna tu alternativu klidně mít může....
Pátek, 23 Září 2022 - 22:03 | no-X | „tohle je dělané primárně na hry kde se postava...
Pátek, 23 Září 2022 - 17:24 | Adams Adams | Chtěl bych říct, že jenom odlišné pojetí (Nvidia...
Pátek, 23 Září 2022 - 17:16 | Honza1616 | Jak jsem psal jinde, tohle je dělané primárně na...
Pátek, 23 Září 2022 - 15:54 | Adams Adams | Ještě je tam třetí finta – zhasínání podsvícení...
Pátek, 23 Září 2022 - 15:43 | Adams Adams | Clickbait rulez! Tomu člověku ty žvásty někdo po...
Pátek, 23 Září 2022 - 15:40 | Adams Adams | AMD má minimálně problém s tím, že i když udělá...
Pátek, 23 Září 2022 - 15:15 | Adams Adams | Bude a nebude. Oni to obešli tak, že tam, kde je...

Zobrazit diskusi