Problém není v 8 GB. I 6GB GeForce RTX 2060 umí být rychlejší než 8GB RTX 5060
Vydání 8GB GeForce RTX 5060 Ti a následně i 8GB GeForce RTX 5060 a částečně i 8GB GeForce RTX 5050 vyvolalo rozhořčení některých YouTube kanálů a s ohledem na jejich sledovanost se přeneslo i na uživatele. Nálady využily i některé redakce, které - když viděly odezvu, jakou kritika 8GB karet vyvolala - začaly pod oheň přikládat rovněž.
Jenže postupně se začalo ukazovat, že 8GB kapacita není až takový problém, respektive že problém je jinde. Tak například jeden z kanálů, který „8GB kauzu“ rozjel, karty netestoval standardní testovací metodikou používanou pro obvyklé recenze, ale za extrémního nastavení (kombinace 4K rozlišení, často ray-tracingu a maximálních detailů). Že by šedesátková řada měla zvládat tuto zátěž, obvyklou pro osmdesátkový a devadesátkový high-end, by asi čekal málokdo.
Druhá indicie se objevila po vydání 8GB verze Radeonu RX 9060 XT, jejíž recenze ukázaly, že zdaleka nekopíruje výrazné výkonnostní propady 8GB GeForce. To bylo přičítáno zejména šestnácti linkám PCIe 5.0 sběrnice, ale podstatná část důvodu může spočívat i jinde.
To potvrdila recenze webu TechSpot zaměřená na mezigenerační výkonnostní posuny šedesátkové řady GeForce za posledních šest let. Ukázala, že v situacích nelimitovaných výkonem procesoru a kapacitou grafické paměti je GeForce RTX 5060 téměř 2× výkonnější než šest let stará GeForce RTX 2060, ale ukázala i jiné věci.
Horizon Zero Dawn Remastered (TechSpot)
Například, že ve hře Horizon Zero Dawn Remastered je 8GB GeForce RTX 5060 pomalejší než 8GB GeForce RTX 4060. Což nedává smysl, když GeForce RTX 5060 je obecně rychlejší a limitace ze strany kapacity paměti je totožná. Jenže, aby toho nebylo málo, 8GB GeForce RTX 5060 je dokonce pomalejší než šest let stará 6GB GeForce RTX 2060. Což z hardwarového hlediska nedává smysl už vůbec, neboť novinka je obecně témě 2× rychlejší, má o třetinu větší kapacitu paměti a 2× rychlejší datovou propustnost PCIe sběrnice navzdory počtu linek (RTX 2060 je PCIe 3.0, RTX 5060 je PCIe 5.0).
×1 | ×2 | ×4 | ×8 | ×16 | |
---|---|---|---|---|---|
PCIe 1.0 | 0,3 GB/s | 0,5 GB/s | 1 GB/s | 2 GB/s | 4 GB/s |
PCIe 2.0 | 0,5 GB/s | 1 GB/s | 2 GB/s | 4 GB/s | 8 GB/s |
PCIe 3.0 | 1 GB/s | 2 GB/s | 4 GB/s | 8 GB/s | 16 GB/s |
PCIe 4.0 | 2 GB/s | 4 GB/s | 8 GB/s | 16 GB/s | 32 GB/s |
PCIe 5.0 | 4 GB/s | 8 GB/s | 16 GB/s | 32 GB/s | 64 GB/s |
PCIe 6.0 | 8 GB/s | 16 GB/s | 32 GB/s | 64 GB/s | 128 GB/s |
Datová propustnost PCIe 5.0 ×8 je 2× vyšší oproti PCIe 3.0 ×16
Z tohoto výsledku je zjevné, že problém moderních 8GB GeForce není primárně v kapacitě paměti. Z informací, které jsou k dispozici, to vypadá, že problém je ve správě paměti, pravděpodobně v absenci optimalizací, které se ještě v době 2GB a 4GB věnovala nemalá péče. Lze vzpomenout vydání ovladačů, která přinášela rozsáhlé optimalizace, jež zvyšovaly výkon karet limitovaných kapacitou paměti, které bývalo mimo high-end ve vybraných hrách docela běžné.
Zdá se, že Nvidia v posledních generacích od těchto optimalizací upustila. Zvlášť s GeForce RTX 5000 se není čemu divit, s nárůstem zájmu o AI akcelerátory se přesunula velká část softwarové péče tímto směrem. Nvidia navíc měla s GeForce RTX 5000 jiné starosti, zejména musela řešit kauzu stability. Těžko říct, zda je absence optimalizací správy paměti důsledkem toho, že „není čas, nejsou lidi“, nebo to už Nvidia ani nevnímá jako prioritu, když jí nedostatečnost 8GB modelů v podstatě dělá reklamu na dražší GeForce, u kterých má vyšší marže. Proč vynakládat prostředky, jejichž výsledek bude, že si zákazník pořídí model, jehož prodejem Nvidia vydělává méně?
V obecné rovině samozřejmě můžeme situaci dávat za vinu i některým tvůrcům her, jejichž tituly, aniž by vypadaly násobně lépe, mají násobně vyšší požadavky na kapacitu paměti. Pro lepší kontext připomenu, jak se k podobné situaci, jakou tu máme dnes, před 10 lety vyjádřil herní vývojář Sebastian Aaltonen:
Mohou tedy 4 GB stačit i pro nové hry ve 4k rozlišení? Sebastian „sebbi“ Aaltonen, vedoucí 3D programátor z RedLynx, tvrdí, že by s rezervou stačily i 2 GB. Ovšem za předpokladu, že by vývojáři správně využívali kompresi textur. Což se podle něj bohužel neděje. Důvody jsou různé. Jednak dosavadní grafiky nabízely tolik paměti, že někteří vývojáři neměli motivaci vůbec nějaké optimalizace využívat a namísto DXT komprese mnohé tituly zůstávaly jen u ZIP/LZMA. Pak jsou tituly, které kompresi využívají, ale ne optimálním způsobem. DirectX nabízí několik režimů komprese značených jako BCn (BC1, BC2 … BC7), které se liší nejen cílovým využitím, ale také verzí DirectX, která je představila: přibližně lze říct, že čím vyšší číslo, tím novější a pokročilejší algoritmus. - Proč tyto režimy nejsou široce rozšířené? Zčásti možná proto, že dokud stačila kapacita grafické paměti pro nekomprimované (nebo neoptimálně komprimované) textury, neměli někteří vývojáři důvod pracovat s novějšími režimy. Dále ale proto, že BC6 a BC7 nejsou podporované DirectX 10 (či starším) hardwarem. - Podle Aaltonena je ale zlepšení jen otázkou času. Uživatelská základna DirectX 10 systémů se bude zmenšovat, počet DirectX 11.2-kompatibilních sestav, které umožní nasazení technologie Tiled Resources (umožňuje efektivní využití textur, které se celé ani nevejdou do paměti), naopak poroste. Technologie DirectX12 (async copy queues, async compute) zase sníží latence při přesunech textur. Aaltonen proto vidí budoucnost docela optimisticky a tvrdí, že čas stávající problémy vyřeší sám: „Doufejme, že tyto nové technologie zarazí brutální plýtvání s pamětí v leckterých PC hrách. Všechny, které jsme dosud viděli, by totiž bylo možné realizovat s použitím méně než 2 GB grafické paměti (dokonce i pro 4k), pokud by využití paměti bylo důsledně optimalizováno.“ |
Pro ilustraci dobového vývoje připomeňme, že nedlouho po přechodu z 2GB na 4GB došlo k významnému poklesu cen pamětí, takže se v high-endu začaly brzy objevovat 6-8GB grafické a namísto k optimalizacím to (některým) vývojářům dalo prostor k ještě většímu plýtvání.
Tato skutečnost sice vysvětluje obecné požadavky her, nezdůvodňuje však vyšší nároky na kapacitu paměti u GeForce z roku 2025 oproti GeForce z roku 2019. To už jde plně za Nvidií.