Nvidia GeForce GTX 680 s čipem GK104: Herní Kepler detailně

22. 3. 2012 | no-X | Technologie, Grafiky, Novinky

V kalendáři dnes máme 22. března, což znamená, že bychom se měli podívat na čerstvě uvedený grafický čip GK104. Těžko ho charakterizovat jednou větou - snad jen že asi bude jiný, než byste čekali…

Kapitoly článků

1. Úvod

2. Unifikované jádro a řízení čipu

3. Paměti, sběrnice a ROP

4. GPU Boost

5. Adaptive V-Sync, Bindless textures

6. Anizotropní filtrace a Anti-Aliasing

7. Výstupy, chlazení a multimedia

8. Závěr

Začít bychom mohli v roce 2007, kdy v Nvidii poprvé padl názor, že by bylo na čase odstartovat přípravy další generace grafických karet. Také bychom mohli začít v San Franciscu v polovině letošního března, kdy Nvidia představila Kepler před zraky novinářů. Ale tentokrát to vezmeme ještě jinak: Co to vlastně je Kepler.

Nvidia GeForce GTX 680 (GK104 Kepler) v SLI

O Kepleru jsme toho za poslední rok mohli číst a slyšet poměrně dost (a teď nemluvím o chaotických smyšlenkách), jen jsme následkem těch informací mohli čekat trochu jiný produkt, než si dnes představíme. Slajdy a útržky z různých prezentací až dosud mluvily především o 3× vyšším poměru double-precision výkonu na watt, GPGPU zaměření a čipu, který snad má připomínat jakousi HPC bestii. Nic takového ale GeForce GTX 680 není. Tu bychom si totiž mohli charakterizovat oficiální reakcí Nvidia na dotaz, jaký výkon v double-precision GTX 680 nabídne:

„Výkon v double-precision bude nižší než v single-precision. Tohle je herní karta pro hráče, takže o těchto věcech nemá smysl mluvit.“

Co to znamená? Zkrátka tolik, že Nvidia podobně jako u minulých generací připravovala dva čipy: Jeden určený primárně pro hráče (například G92 / GTS 250, GF104 / GTX 460 nebo GF114 / GTX 560) a druhý s rozšířenou podporou pro GPGPU / HPC funkcionalitu (jako byly kupříkladu GT200 / GTX 280, GF100 / GTX 480 či GF110 / GTX 580). Stejně jako GF104 a GF114, tak i GK104 z generace Kepler je tím hráčským čipem. Rozdíl je v tom, že Nvidia zatím druhý z čipů v nejbližší době nevydá, a tak se tentokrát rozhodla pro hráčský čip použít označení GeForce GTX 680.

Nvidia GeForce GTX 680 GPU a PCB

V tomto kontextu už vás asi nepřekvapí, že karta nenese žádný monstrózní ~500mm² čip, ale GPU spíše o dvě stovky milimetrů čtverečních menší, které se blíží ~300 mm². Konkrétně mluvíme o ploše 294 mm², což je více než měla třeba G92b (GeForce GTS 250), ale zase o 65mm² méně, než v případě mainstreamových Fermi GF104 a GF114 (GeForce GTX 460 / 560).

GPU	karta	rozměry	sběrnice
GT200	GeForce GTX 280	576 mm²	512bit
GF100	GeForce GTX 480	529 mm²	384bit
G80	GeForce 8800 GTX	484 mm²	384bit
GT200b	GeForce GTX 285	470 mm²	512bit
R600	Radeon HD 2900 XT	420 mm²	512bit
Cayman	Radeon HD 6970	389 mm²	256bit
Tahiti	Radeon HD 7970	365 mm²	384bit
GF114	GeForce GTX 560 Ti	360 mm²	256bit
R580	Radeon X1900 XTX	342 mm²	256bit
Cypress	Radeon HD 5870	336 mm²	256bit
G92	GeForce 9800 GTX	334 mm²	256bit
G70	GeForce 7800 GTX	334 mm²	256bit
GK104	GeForce GTX 680	294 mm²	256bit
R520	Radeon X1800 XT	288 mm²	256bit
NV40	GeForce 6800 Ultra	287 mm²	256bit
RV790	Radeon HD 4890	282 mm²	256bit
R420	Radeon X800 XT	281 mm²	256bit
G92b	GeForce GTS 250	264 mm²	256bit
RV770	Radeon HD 4870	256 mm²	256bit
R430	Radeon X800 XL	240 mm²	256bit
RV570	Radeon X1950 PRO	230 mm²	256bit
G94	GeForce 9600 GT	225 mm²	256bit
R300	Radeon 9700 PRO	218 mm²	256bit
NV42	GeForce 6800 GS	213 mm²	256bit
Pitcairn	Radeon HD 7870	212 mm²	256bit
G71	GeForce 7900 GTX	196 mm²	256bit
RV670	Radeon HD 3870	192 mm²	256bit

Do tabulky jsme pro srovnání zahrnuli i kompletní výčet DX9+ grafických čipů, které nesly 256bit sběrnici - zajímavé je všimnout si, že existují 256bit čipy o 100 mm² menší i o 100 mm² větší než Nvidia GK104. Bouřlivé internetové diskuse na téma velikosti jádra této grafické karty asi hned tak neutichnou; na GPU můžeme nahlížet několika způsoby: Na high-end Nvidie posledních let je malý, ve srovnání s high-endem ATI/AMD posledních generací vychází srovnatelně, mezi 256bit čipy zase spadá do třetiny největších.

Nvidia GK104 (vlevo) a AMD Tahiti (vpravo)

Také lze velikost jádra srovnat s novými produkty AMD: Oproti Tahiti (HD 7970) je Kepler o 71 mm² menší, oproti Pitcairn (HD 7870) zase o 82 mm² (39 %) větší. Tolik k proporcím křemíku, teď už přejděme k samotným specifikacím:

	GeForce GTX 560 Ti	GeForce GTX 580	GeForce GTX 680
GPU	Nvidia GF114 1,95 mld. tr.	Nvidia GF110 3,00 mld. tr.	Nvidia GK104 3,54 mld. tr.
Plocha jádra	360 mm²	520 mm²	294 mm²
Výrobní proces	40nm TSMC	40nm TSMC	28nm TSMC
Frekvence	822 MHz	772 MHz	1006 MHz
Hot-clock	1645 MHz	1545 MHz
Boost-clock			1058 MHz
SPs (CUDA)	384	512	1536
TMUs	64	64	128
ROPs	32	48	32
Výkon (single precision)	1,26 TFLOPS	1,58 TFLOPS	3,09 TFLOPS
Výkon (double precision)	0,10 TFLOPS	0,20 TFLOPS	„méně než v SP“
Paměti	1 GB 256bit GDDR5	1,5-3 GB 384bit GDDR5	2 GB 256bit GDDR5
Frekvence pamětí	4,0 GHz	4,0 GHz	6,0 GHz
Dat. propustnost	128 GB/s	192 GB/s	192 GB/s
Spotřeba ve 3D	170 W	244 W	195 W
Napájení	6+6-pin	6+8-pin	6+6-pin
Výstupy	2× DVI-I mini-HDMI 1.4a	2× DVI-I mini-HDMI 1.4a	DVI-I, DVI-D DisplayPort HDMI 1.4a
Rozhraní	PCIe 2.0 ×16	PCIe 2.0 ×16	PCIe 3.0 ×16
DirectX	11	11	~~11.1~~ 11

V tabulce vás mohly zaujmout dva údaje: Jednak nová položka „boost-clock“, ke které se ještě vrátíme a dál absence hodnoty „hot-clock“, tedy frekvence unifikovaného jádra, která byla u všech čipů generace Fermi dvojnásobkem základního taktu. Kam se poděla, se podíváme na následující straně.

Tagy: