Uniklé slajdy o GeForce GTX 1080 potvrzují plochu jádra, 64 ROP a lepší kompresi
Pro lepší přehlednost jsme nově potvrzené informace zdůraznil tučně. Hned úvodem začneme doplněnou tabulkou. Nově je potvrzena plocha jádra 314 mm² a počet 64 ROP. Tyto parametry se nijak nevymykají očekávání. Nejinak je tomu u počtu texturovacích jednotek, kterých jádro GP104 a tudíž i GeForce GTX 1080 nese celkem 160.
GeForce GTX 1070 | GeForce | GeForce GTX 980 | GeForce GTX 980 Ti | GeForce GTX Titan X | |
GPU | GP104 7,2 mld. tr. | GP104 7,2 mld. tr. | GM204 5,2 mld. tr. | GM200 | GM200 8 mld. tr. |
Plocha | 314 mm² | 314 mm² | 398 mm² | 601 mm² | 601 mm² |
Proces | 16 nm TSMC | 16 nm TSMC | 28 nm TSMC | 28 nm TSMC | 28 nm TSMC |
Architektura | Pascal | Pascal | Maxwell | Maxwell | Maxwell |
Frekvence | >1500 MHz? | 1607 MHz | 1126 MHz | 1002 MHz | 1002 MHz |
Boost | <1700 MHz? | 1733 MHz | 1216 MHz | 1075 MHz | 1075 MHz |
SPs | 2048-2304? | 2560 | 2048 | 2816 | 3072 |
TMUs | 128-144? | 160 | 128 | 176 | 192 |
ROPs | ? | 64 | 64 | 96 | 96 |
Výkon | ? | 8,23 TFLOPS | 4,61 TFLOPS | 5,64 TFLOPS | 6,16 TFLOPS |
Výkon (DP) | ? | 0,26 TFLOPS? | 0,14 TFLOPS | 0,18 TFLOPS | 0,19 TFLOPS |
Paměti | 8 GB 256bit | 8 GB | 4 GB 256bit | 6 GB 384 bit GDDR5 | 12 GB 384bit GDDR5 |
Takt | 8 GHz? | 10 GHz | 7 GHz | 7 GHz | 7 GHz |
Dat. prop. | 256 GB/s? | 320 GB/s | 224 GB/s | 336 GB/s | 336 GB/s |
spotř. 3D | ~150 W? | 180 W | 165 W (180 W) | 250 W | 250 W |
Napájení | ? | 8-pin | 6+6 pin | 6+8 pin | 6+8 pin |
Výstupy | DVI 3× DP 1.2/1.4 HDMI 2.0b | DVI | DVI 3× DP | DVI | DVI |
Rozhraní | PCIe 3.0 ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 |
API | DirectX 12 | DirectX 12 | DirectX 11.3 DirectX 12 | DirectX 11.3 | DirectX 11.3 |
datum | 6. 5. 2016 10. 6. 2016 | 6. 5. 2016 17. 5. 2016 27. 5. 2016 | 18. 9. 2014 | 1. 6. 2015 | 17. 3. 2015 |
cena | $449 $379 | $699 $599 | $549 | $649 | $999 |
Tím se rovnou dostáváme ke konfiguraci jádra. Oproti očekávání, které nastínila prezentace jádra GP100, je situace jiná. Zatímco velký Pascal alias GP100 upravil SM bloky tak, že namísto 128 stream-procesorů (jako u Maxwellu) jich nesou pouze 64, ale o to větší prostor pro registry mají, menší herní Pascal alias GP104 (GeForce GTX 1080) zůstává u stejné konfigurace - 128. Konfigurace SM bloků GP104 je tedy totožná jako u Maxwellu a nezměněna zůstala i kapacita registrů.
Stream-procesory a texturovací jednotky máme odbyté, přejděme k ROP. Aby nestrádaly nedostatkem datové propustnosti, která je i přes nasazení 10GHz GDDR5X pouze srovnatelná s GeForce GTX 980 Ti, vylepšila Nvidia kompresi. Podle oficiálních materiálů účinnost delta-komprese vzrostla o 20 %. To je zčásti důsledkem zahrnutí nových algoritmů:
Další porce změn se týká zobrazování. Pascal GP104 podporuje HDR a to i pro video. Oproti čipům předešlé generace (s výjimkou GM206) zvládá hardwarové přehrávání HEVC s 10bit hloubkou a zcela nově i 12bit. To se ovšem týká pouze dekomprese, komprese je podporována i nadále max. 10bit.
Přibyla nová metoda synchronizace, kterou Nvidia prezentuje jako lepší alternativu k v-sync. Nazývá ji fast sync. Technologický popis zatím chybí - můžeme zatím říct jen tolik, že podobně jako v-sync eliminuje lámání obrazu (tearing), přičemž ale vykazuje nižší latence.
Další dodatky se týkají vylepšeného rozhraní SLI, tzv. SLI HB neboli SLI s HB-bridge, který zvyšuje datovou propustnost mezi spolupracujícími jádry (ovšem na úkor propojení max. dvou karet v tomto režimu). Zatímco původní koncept umožňoval komunikaci přes můstek nanejvýš do rozlišení 2560×1440 při 60 Hz (vše výš už se přesouvalo po sběrnici), s HB-bridge je možné přes můstek posílat i 2560×1440 při 120 Hz a dále 4k a 5k (bez upřesněných Hz/FPS; patrně však do 60 Hz). Slajd ilustruje hladší průběh snímkové frekvence, výrazně nižší microstuttering.
Nvidia hovoří také o zlepšení podpory pro asynchronní výpočty. Používá výslovně termín „async compute“, na druhou stranu hovoří o grafice, takže prezentace působí, jakoby se zlepšení měla promítnout i na úrovni asynchronních shaderů. To je zatím předčasné hodnotit, každopádně bylo implementováno automatické vyvážení výkonu (dynamic load balancing), které by z využití asynchronních shaderů mělo vytěžit nějaký výkon navíc.