Co stojí za energetickou efektivitou Maxwellu - GeForce GTX 980?
Pokud je nám známo, nedodala Nvidia žádné redakci informace o tom, kde nebo jak tuto porci energie ušetřila. Do jisté míry je to pochopitelné, z marketingového hlediska je výhodnější, pokud to průměrný uživatel vnímá jako malý zázrak, ze kterého je nadšený, aniž by rozuměl jeho podstatě. Zázraky se ale (minimálně v křemíku) nedějí, a tak se zkusíme trochu zamyslet, na čem Nvidia mohla tyto watty ušetřit.
V obecné rovině existuje řada prostředků, která může bez negativních dopadů na výkon pozitivně ovlivnit reálnou spotřebu nebo alespoň snížit TDP limity. Jsou to například modernější (menší) výrobní proces, vylepšená varianta téže generace výrobního procesu, technologie na recyklaci energie, architektura eliminující nebo snižující energeticky náročné přenosy dat, různé režimy variabilní taktovací frekvence s automatickou úpravou napětí a podobně.
Co víme jistě, je, že Maxwell nepostihla změna výrobního procesu, zůstal na 28 nanometrech od TSMC, takže toto si můžeme vyškrtnout. Také turbo / boost podporovala již minulá generace, takže v tomto ohledu lze očekávat pouze minimální změny. Jistou dobu se hodně mluvilo o zjednodušení infrastruktury jádra, která nebude vyžadovat složitý systém propojení jednotlivých SM bloků (integrujících stream-procesory a texturovací jednotky). Tato změna může stát za nezanedbatelným snížením energetických nároků, ale nezdá se, že by ho vysvětlovala plně.
Určité světlo do situace vnesla recenze webu TomsHardware, ve které vyšlo najevo zajímavé chování Maxwellu. Stejně jako všechny produkty posledních dvou generací má GeForce GTX 980 nastavený určitý limit TDP / spotřeby, který se karta snaží nepřekročit. Pokud ale dojde na nereferenční OC edice karet, mohou jejich výrobci tento limit zvýšit (teoreticky i deaktivovat), aby karta reálně dosahovala propagovaných OC taktů a nelimitovala ji příliš těsně nastavená ochrana.
Právě u OC modelu společnosti Gigabyte se v testu spotřeby objevila zajímavá „anomálie“. Zatímco v herní zátěži se spotřeba referenční karty a OC verze se zvýšeným TDP limitem příliš nelišila, ve výpočetní zátěži (GPGPU) se OC model dokázal vyšplhat o 100 wattů nad úroveň herní spotřeby a dostal se na spotřebu, jakou bychom od ~400mm² ~1200MHz GPU očekávali. Čím to?
Z takového chování je evidentní, že hlavní porce snížené spotřeby architektury Maxwell není způsobena technologií nebo prvkem architektury, který by měl permanentní vliv (jako jsou například menší výrobní proces, recyklace energie apod.), ale že jde o technologii, jejíž účinnost je extrémně závislá na typu zátěže, které je GPU vystaveno.
Právě herní a výpočetní zátěž se velmi výrazně liší. Při hrách není nikdy aktivní celé GPU - nikdy nejsou plně vytížené všechny stream-procesory a cache, vždy se najde některá část jádra, která čeká na jinou, jednou se čeká na datový přenos, podruhé na práci ROP jednotek a podobně. Oproti tomu GPGPU kód je možné mnohem snáz optimalizovat tak, aby permanentně vytěžoval celé výpočetní jádro.
Nvidii se zřejmě podařilo implementovat takový systém řízení spotřeby, který je schopný posílat do úsporného režimu (nebo i zcela vypínat) výpočetní jednotky či jiné části čipu, které nejsou aktivní a to i v rámci tak krátkých časových úseků, po které jsou tyto části čipu nevyužité při herní zátěži. Protože se prakticky nenajde okamžik, po který by v běžných hrách bylo aktivní celé GPU, neodpovídá ani herní spotřeba Maxwellu tomu, co bychom od ~400mm² ~1200MHz GPU očekávali, ale pouze právě aktivní části jádra - zlomku spotřeby, které čip dosahuje ve vhodně optimalizovaném výpočetním kódu.
TomsHardware aj.