GeForce RTX 4000 již v červenci a vyšší energetická efektivita(?)
Přestože se již dříve objevovaly zvěsti o tom, že by nová generace GeForce s architekturou Lovelace mohla být vydána v první polovině léta, později se většina zdrojů začala shodovat na druhé, přičemž jako nejpravděpodobnější termín vydání bylo předkládáno září. Podle leakera kopite7kimi ale půjde o termín bližší začátku léta, což by nejspíš znamenalo červenec, možná začátek srpna.
S tímto datem ale jde ruku v ruce otázka, jak by asi vypadaly uživatelské reakce, pokud by Nvidia vydala 600W grafickou kartu v polovině léta. Podle RedGamingTech by to ale ani v tomto ohledu nemuselo být až tak žhavé. Zprávy o 600W modelu a 2,1× mezigeneračním nárůstu výkonu mají být sice pravdivé, ale nemají se týkat jedné karty. Model, který bude asi 2,1× rychlejší než současný high-end, bude mít nižší TDP (že by šlo o onu kdysi avizovanou 450W kartu?) a naopak 600W model má být nezanedbatelně výkonnější (snad 2,4-2,5×).
zdroj: kopite7kimi
Ve světle specifikací zvřejněných leakerem kopite7kimi by 450W kartu s výkonem zhruba dvojnásobným oproti současnému high-endu bylo možné ztotožnit s GeForce RTX 4090. Ta má nést 16 128 stream-procesorů a 24 GB 21GHz GDDR6X. Tento leaker také zveřejnil tabulku, která srovnává strukturu jádra AD102 / Lovelace s čipy předchozích generací. Většina řádků nepřináší žádné zásadní zvraty; za pozornost stojí spíše dolní část tabulky. L1 cache bude mezigeneračně zdvojnásobena a L2 cache má stoupnout na 96 MB (což už jsme avizovali) začátkem března.
Předpokládaná podoba TPC architektury Lovelace (dvojice SM)
Jediný opravdu překvapivý údaj se týká ROP jednotek, jejichž počet má stoupnout ze stávajících 112 na 384 (32 × 12). To je mezigenerační nárůst 3,43× a to nezapočítáváme vliv taktovacích frekvencí. Při pouze 15% zvýšení taktů by šlo o 4× vyšší fillrate.
Taková změna je zarážející hned ze tří důvodů. Za prvé: Pokud je cílem dosáhnout mezigeneračního posunu v herním výkonu 2-2,5×, proč zvyšovat fillrate 4×? Za druhé: Pokud je (v důsledku limitovaných posunů ve výrobních procesech) prostor pro mezigenerační navyšování tranzistorů stále menší, proč tyto tranzistory věnovat právě ROP jednotkám? Za třetí: Historicky docházelo k významnému navyšování počtu ROP většinou ve vztahu ke generacím, za kterých se zvyšovalo cílové rozlišení. Pokud současný high-end cílil na 4K, pak by 4× vyšší fillrate odpovídal 8K, což nezní pravděpodobně. Už nyní to vypadá, že se vyšší rozlišení budou řešit převážně technikami pro upsampling (DLSS, FSR, případně XeSS od Intelu).
Jak si tedy údaje o extrémním navýšení počtu ROP vysvětlovat? První možností je, že Nvidia má nějaký plán, který není na první pohled zjevný a pro který dává tento krok smysl (snad souvislost s 96MB L2 cache?). Druhou možností je, že ROP je sice vyšší počet, ale nejsou stejné jako u předchozí generace a podobně jako je tomu u RDNA 3, došlo k jejich odlehčení (každá ROP jednotka stojí méně tranzistorů). Jako třetí možnost musíme připustit i variantu, že došlo k nějakému chybnému přepisu nebo interpretaci údajů a ROP nebude 384, ale třeba polovina, 192.