Nvidia GeForce GTX 680 s čipem GK104: Herní Kepler detailně
Kapitoly článků
Začít bychom mohli v roce 2007, kdy v Nvidii poprvé padl názor, že by bylo na čase odstartovat přípravy další generace grafických karet. Také bychom mohli začít v San Franciscu v polovině letošního března, kdy Nvidia představila Kepler před zraky novinářů. Ale tentokrát to vezmeme ještě jinak: Co to vlastně je Kepler.
Nvidia GeForce GTX 680 (GK104 Kepler) v SLI
O Kepleru jsme toho za poslední rok mohli číst a slyšet poměrně dost (a teď nemluvím o chaotických smyšlenkách), jen jsme následkem těch informací mohli čekat trochu jiný produkt, než si dnes představíme. Slajdy a útržky z různých prezentací až dosud mluvily především o 3× vyšším poměru double-precision výkonu na watt, GPGPU zaměření a čipu, který snad má připomínat jakousi HPC bestii. Nic takového ale GeForce GTX 680 není. Tu bychom si totiž mohli charakterizovat oficiální reakcí Nvidia na dotaz, jaký výkon v double-precision GTX 680 nabídne:
„Výkon v double-precision bude nižší než v single-precision. Tohle je herní karta pro hráče, takže o těchto věcech nemá smysl mluvit.“
Co to znamená? Zkrátka tolik, že Nvidia podobně jako u minulých generací připravovala dva čipy: Jeden určený primárně pro hráče (například G92 / GTS 250, GF104 / GTX 460 nebo GF114 / GTX 560) a druhý s rozšířenou podporou pro GPGPU / HPC funkcionalitu (jako byly kupříkladu GT200 / GTX 280, GF100 / GTX 480 či GF110 / GTX 580). Stejně jako GF104 a GF114, tak i GK104 z generace Kepler je tím hráčským čipem. Rozdíl je v tom, že Nvidia zatím druhý z čipů v nejbližší době nevydá, a tak se tentokrát rozhodla pro hráčský čip použít označení GeForce GTX 680.
Nvidia GeForce GTX 680 GPU a PCB
V tomto kontextu už vás asi nepřekvapí, že karta nenese žádný monstrózní ~500mm² čip, ale GPU spíše o dvě stovky milimetrů čtverečních menší, které se blíží ~300 mm². Konkrétně mluvíme o ploše 294 mm², což je více než měla třeba G92b (GeForce GTS 250), ale zase o 65mm² méně, než v případě mainstreamových Fermi GF104 a GF114 (GeForce GTX 460 / 560).
GPU | karta | rozměry | sběrnice |
---|---|---|---|
GT200 | GeForce GTX 280 | 576 mm² | 512bit |
GF100 | GeForce GTX 480 | 529 mm² | 384bit |
G80 | GeForce 8800 GTX | 484 mm² | 384bit |
GT200b | GeForce GTX 285 | 470 mm² | 512bit |
R600 | Radeon HD 2900 XT | 420 mm² | 512bit |
Cayman | Radeon HD 6970 | 389 mm² | 256bit |
Tahiti | Radeon HD 7970 | 365 mm² | 384bit |
GF114 | GeForce GTX 560 Ti | 360 mm² | 256bit |
R580 | Radeon X1900 XTX | 342 mm² | 256bit |
Cypress | Radeon HD 5870 | 336 mm² | 256bit |
G92 | GeForce 9800 GTX | 334 mm² | 256bit |
G70 | GeForce 7800 GTX | 334 mm² | 256bit |
GK104 | GeForce GTX 680 | 294 mm² | 256bit |
R520 | Radeon X1800 XT | 288 mm² | 256bit |
NV40 | GeForce 6800 Ultra | 287 mm² | 256bit |
RV790 | Radeon HD 4890 | 282 mm² | 256bit |
R420 | Radeon X800 XT | 281 mm² | 256bit |
G92b | GeForce GTS 250 | 264 mm² | 256bit |
RV770 | Radeon HD 4870 | 256 mm² | 256bit |
R430 | Radeon X800 XL | 240 mm² | 256bit |
RV570 | Radeon X1950 PRO | 230 mm² | 256bit |
G94 | GeForce 9600 GT | 225 mm² | 256bit |
R300 | Radeon 9700 PRO | 218 mm² | 256bit |
NV42 | GeForce 6800 GS | 213 mm² | 256bit |
Pitcairn | Radeon HD 7870 | 212 mm² | 256bit |
G71 | GeForce 7900 GTX | 196 mm² | 256bit |
RV670 | Radeon HD 3870 | 192 mm² | 256bit |
Do tabulky jsme pro srovnání zahrnuli i kompletní výčet DX9+ grafických čipů, které nesly 256bit sběrnici - zajímavé je všimnout si, že existují 256bit čipy o 100 mm² menší i o 100 mm² větší než Nvidia GK104. Bouřlivé internetové diskuse na téma velikosti jádra této grafické karty asi hned tak neutichnou; na GPU můžeme nahlížet několika způsoby: Na high-end Nvidie posledních let je malý, ve srovnání s high-endem ATI/AMD posledních generací vychází srovnatelně, mezi 256bit čipy zase spadá do třetiny největších.
Také lze velikost jádra srovnat s novými produkty AMD: Oproti Tahiti (HD 7970) je Kepler o 71 mm² menší, oproti Pitcairn (HD 7870) zase o 82 mm² (39 %) větší. Tolik k proporcím křemíku, teď už přejděme k samotným specifikacím:
GeForce GTX 560 Ti | GeForce GTX 580 | GeForce GTX 680 | |
---|---|---|---|
GPU |
Nvidia GF114 1,95 mld. tr. |
Nvidia GF110 3,00 mld. tr. |
Nvidia GK104 3,54 mld. tr. |
Plocha jádra | 360 mm² | 520 mm² | 294 mm² |
Výrobní proces | 40nm TSMC | 40nm TSMC | 28nm TSMC |
Frekvence | 822 MHz | 772 MHz | 1006 MHz |
Hot-clock | 1645 MHz | 1545 MHz | |
Boost-clock | 1058 MHz | ||
SPs (CUDA) | 384 | 512 | 1536 |
TMUs | 64 | 64 | 128 |
ROPs | 32 | 48 | 32 |
Výkon (single precision) |
1,26 TFLOPS | 1,58 TFLOPS | 3,09 TFLOPS |
Výkon (double precision) |
0,10 TFLOPS | 0,20 TFLOPS | „méně než v SP“ |
Paměti |
1 GB 256bit GDDR5 |
1,5-3 GB 384bit GDDR5 |
2 GB 256bit GDDR5 |
Frekvence pamětí | 4,0 GHz | 4,0 GHz | 6,0 GHz |
Dat. propustnost | 128 GB/s | 192 GB/s | 192 GB/s |
Spotřeba ve 3D | 170 W | 244 W | 195 W |
Napájení | 6+6-pin | 6+8-pin | 6+6-pin |
Výstupy |
2× DVI-I mini-HDMI 1.4a |
2× DVI-I mini-HDMI 1.4a |
DVI-I, DVI-D DisplayPort HDMI 1.4a |
Rozhraní | PCIe 2.0 ×16 | PCIe 2.0 ×16 | PCIe 3.0 ×16 |
DirectX | 11 | 11 |
|
V tabulce vás mohly zaujmout dva údaje: Jednak nová položka „boost-clock“, ke které se ještě vrátíme a dál absence hodnoty „hot-clock“, tedy frekvence unifikovaného jádra, která byla u všech čipů generace Fermi dvojnásobkem základního taktu. Kam se poděla, se podíváme na následující straně.
Nvidia (prezentace v San Franciscu a oficiální materiály)