GeForce RTX 4090 v GeekBench: 60-63 % nad GeForce RTX 3090 Ti
Nvidia se při ohlášení GeForce RTX 4090 zaměřila na výkonnostní výsledky ve hrách zaměřených na raytracing a DLSS 3.0, které dostalo do vínku schopnost vymýšlení nových obrazových snímků. Na každý jeden vykreslený snímek (a zvětšený podobným způsobem jako DLSS 2.0) může být doplněn druhý, který je vygenerován algoritmem využívajícím mimo jiné AI.
DLSS 3.0, „vymyšlený“ snímek uprostřed, dle DigitalFoundry
Protože Nvidia neposkytla prakticky žádné výsledky v tradiční rasterizaci a DLSS 3.0 v praxi nevypadá na takový zázrak, za jaký ho CEO Jen-Hsun Huang předkládal (obraz v pohybu je rozpadlý a obsahuje artefakty, viz výše), zajímá uživatele především reálný výkon karty.
Než budeme mít k dispozici kompletní výsledky nezávislých testů, ještě nějaký čas uteče, ale v databázi testu GeekBench se již objevilo skóre ve výpočetní zátěži naměřené právě na GeForce RTX 4090. Skóre bylo 417 713, tedy ~60 % nad GeForce RTX 3090 Ti (260 346 bodů). Poté, co některé weby tento údaj odpublikovaly a reakce čtenářů z 60% posunu nezněly příliš nadšeně, se ještě objevilo druhé (o něco lepší) skóre dosahující 424 332 bodů, tedy 63 % nad GeForce RTX 3090 Ti.
GeForce RTX 4070 | GeForce RTX 4080 12GB | GeForce RTX 4080 16GB | GeForce RTX 4080 Ti | GeForce RTX 4090 | (?) Titan / RTX 4090 Ti | |
---|---|---|---|---|---|---|
GPU | AD104 ~30 mld. tr. [7680 SP] | AD103 45,9 mld. tr. [10752 SP] | AD102 >75 mld. tr. [18432 SP] | |||
plocha | 295 mm² | 379 mm² | 608 mm² | |||
proces | 4nm TSMC | |||||
takt | ? | 2310 MHz | 2205 MHz | ? | 2235 MHz | ? |
boost | ? | 2610 MHz | 2505 MHz | ? | 2520 MHz | >2750 MHz(?) |
stream proc. | 7168? | 7680 | 9728 | 14848 | 16384 | 18432 18176 |
TMU | 224 | 240 | 304 | 464 | 512 | 568 |
ROP | ? | 80? | 112? | ? | 192? | ? |
FP32 TFLOPS | ? | 40 | 49 | >70 | 82 | ~100 |
sběrnice | 160bit? | 192bit | 256bit | 320bit | 384bit | 384bit |
paměť | ? | 21 GHz | 23 GHz GDDR6X | 21 GHz | 21,2 GHz | 24 GHz |
kapacita | 10 GB | 12 GB | 16 GB | 20 GB | 24 GB | 48 GB |
data | ? | 504 GB/s | 736 GB/s | 840 GB/s | 1,01 TB/s | 1,15 TB/s |
napájení | ? | 16pin | 16pin | 16pin | 16pin | 2× 16pin(?) |
TDP | ? | 285 | 320W | ~400W? | 450W | ~600W? |
cena | ? | $899 | $1199 | ? | $1599 | ? |
datum vydání | ? | listop. '22 | listop. '22 | ? | říjen '22 | ? |
I přesto se nelze ubránit dojmu, že kartu cosi brzdí. Mezigenerační nárůst teoretického výpočetního výkonu je mezi zmíněnými modely podstatně vyšší: 40→82 TFLOPS, tedy +105 % (2,05×). U herní zátěže lze očekávat, že výkon může být tu limitován procesorem, tam počtem texturovacích jednotek, jinde počtem ROP. Výpočetní výkon by měl být řady z těchto limitací oproštěn - zatím se však posun ani neblíží očekávaným hodnotám.
V tuto chvíli není jasné, zda Nvidia chystá nějaké překvapení, nebo je výkon limitován například ze strany TDP (proslýchalo se, že by karty měly umožňovat přepnutí na podstatně vyšší TDP), nebo třeba ze strany paměťové propustnosti, která se oproti minulé generaci prakticky nezvýšila a je řešena čistě zvětšenou (96MB) L2 cache.