GeForce RTX 4090 vydána, spotřeba v tovární konfiguraci nepřesahuje RTX 3090 Ti
GeForce RTX 4090 je postavena na jádru Lovelace AD102 vyrobeném na 4nm procesu TSMC. Z celkových 18432 stream-procesorů disponuje 16384 aktivními, dále (aktivními) 512 texturovacími jednotkami a 176 ROP. Na 384bit sběrnici je připojeno 24 GB GDDR6X paměti od Micronu.
GeForce RTX 4080 12GB | GeForce RTX 4080 16GB | GeForce RTX 4080 Ti | GeForce RTX 4090 | (?) Titan / RTX 4090 Ti | |
---|---|---|---|---|---|
GPU | AD104 35,8 mld. tr. [7680 SP] | AD103 45,9 mld. tr. [10752 SP] | AD102 75,3 mld. tr. [18432 SP] | ||
plocha | 295 mm² | 379 mm² | 608 mm² | ||
proces | 4nm TSMC | ||||
takt | 2310 MHz | 2205 MHz | ? | 2235 MHz | ? |
boost | 2610 MHz | 2505 MHz | ? | 2520 MHz | >2750 MHz(?) |
stream proc. | 7680 | 9728 | 14848 | 16384 | 18432 18176 |
TMU | 240 | 304 | 464 | 512 | 568 |
ROP | 80 | 112 | ? | 176 | ? |
FP32 TFLOPS | 40 | 49 | >70 | 83 | ~100 |
sběrnice | 192bit | 256bit | 320bit | 384bit | 384bit |
paměť | 21 GHz | 23 GHz GDDR6X | 21 GHz | 21,2 GHz | 24 GHz |
kapacita | 12 GB | 16 GB | 20 GB | 24 GB | 48 GB |
data | 504 GB/s | 736 GB/s | 840 GB/s | 1,01 TB/s | 1,15 TB/s |
LLC | 48 MB | 64 MB | ? | 72 MB | 96 MB |
napájení | 16pin | 16pin | 16pin | 16pin | 2× 16pin(?) |
TDP | 285W | 320W | ~400W? | 450-600W | ~600W? |
cena | $899 | $1199 | ? | $1599 | ? |
datum vydání | listop. '22 | listop. '22 | ? | 11. 10. '22 | ? |
Karta, vybavená 16pin napájecím konektorem, podporuje výchozí 450W TDP, ale je možné limit zvýšit na 600W TDP. Podrobné testování s 600W limitem zatím některé weby odložily, neboť toto nastavení vyžaduje plně zapojenou napájecí redukci (4× osmipin) a nástroj PCAT, který Nvidia před dvěma lety poskytla některým redakcím k měření spotřeby nepodporuje více než tři osmipinové konektory zároveň:
Podle redakce webu ComputerBase ale zvýšení limitu neznamená vždy zvýšení výkonu, protože ne vždy je při továrních taktech výkon limitován spotřebou. I z tohoto hlediska se jeví jako rozumné, že Nvidia zůstala u výchozího TDP 450 wattů.
K výkonu:
Podle ComputerBase se výkon GeForce RTX 4090 oproti GeForce RTX 3090 Ti zvyšuje o 65 %.
Podle TechPowerUp odpovídá posun ve srovnání s GeForce RTX 3090 Ti jen 45 % a pokud bychom srovnávali oba modely bez „Ti“, pak 64 %.
Je pravděpodobné, že významný vliv bude mít jak výběr her. Jistý podíl může mít i CPU, kdy TechPowerUp testuje na Ryzen 7 5800X (ten původní, nikoli X3D) a ComputerBase na o rok novějším Core i9-12900K. V tomto případě by se však hodil alespoň některý Ryzen 7000, lépe Ryzen 7000X3D, který však ještě není vydaný. Bez výkonnějších procesorů nelze objektivně hodnotit, do jaké míry způsobily rozdíly mezi recenzemi odlišné sady her a do jaké odlišné procesory.
Ke spotřebě:
TechPowerUp naměřil průměrnou herní spotřebu 346 wattů (což je dokonce méně než u GeForce RTX 3090), ale maximální spotřebu 468 wattů, což přesahuje TDP a je o více než 100 wattů nad GeForce RTX 3090.
ComputerBase v zátěži Doom Eternal naměřila 432 wattů, tj. méně než TDP nebo GeForce RTX 3090 Ti.
Energetická efektivita stoupla o 55 % oproti GeForce RTX 3080 a o 40 % oproti Radeonu RX 6800, který byl nejefektivnějším zástupcem minulé generace. Na jednu stranu jde o nepopiratelný posun, na stranu druhou, pokud si uvědomíme, že oproti předchozím GeForce šlo o posun následující řady procesů…
- 8nm (Ampere) → 7nm (RDNA 2) → 6nm → 5nm → 4nm (Lovelace)
…a Nvidia ještě zvolila poměrně konzervativní frekvence a nižší TDP přispívající k energetické efektivitě, tak nejde o vysloveně velký skok. Generace jako Nvidia Maxwell nebo AMD RDNA2 dokázal podobných posunů dosáhnout při zachování stejného procesu, jakého využívala předchozí generace a ještě k tomu podstatně zvýšit taktovací frekvence:
Maxwell (GeForce GTX 900) přinesl až ~53% navýšení energetické efektivity
při zachování výrobního procesu svého předchůce. Zdroj: Hardware.fr
Následuje hlučnost:
Hluk je trochu vyšší než u GeForce RTX 3090, ale zároveň nižší než u GeForce RTX 3090 Ti. S ohledem na změny chladiče (lopatky, průměr ventilátoru) bude podstatnější subjektivní vnímání hluku než zda je o pár decibelů vyšší nebo nižší.
Výsledky recenzí vysvětlují, proč Nvidia v materiálech uváděla převážně jen výsledky s DLSS (3.0) a/nebo s RayTracingem. Výkonnostní posun v klasické rasterizaci (+45 až +65 %) sice není špatný, ale zdaleka se neblíží posunu v aritmetickém výkonu, texturovacím výkonu a fillrate, který by měl být kolem +110 % a to ještě bez architektonických vylepšení:
GeForce RTX 3090 Ti | GeForce RTX 4090 | nárůst | |
---|---|---|---|
FP32 | 40 TFLOPS | 83 TFLOPS | 2,1× |
texturing | 0,625 TTxl/s | 1,29 TTxl/s | 2,1× |
fillrate | 208 GPxl/s | 444 GPxl/s | 2,1× |
Kartu tedy, zdá se, cosi dost podstatně limituje. Nemusí jít o jeden prvek, ale i více vlivů. Může to být částečně procesorový výkon, částečně nedostatečná paměťová propustnost (kterou Nvidia řešila více-méně jen zavedením větší L2 cache).
Bez ohledu na to je karta zajímavá - jen přinesla trochu něco jiného, než se od ní čekalo. Namísto nekompromisního řešení přinášejícího 2× vyšší výkon s 600W spotřebou tu máme obvyklý mezigenerační posun se 450W TDP (a reálnou spotřebou o něco lepší ne u GeForce RTX 3090 Ti).