Velký rozbor: Nvidia GeForce GTX Titan - karta postavená pro recenze?
Kapitoly článků
O tom, že Nvidia kromě čipu GK104 uvedeného v rámci GeForce GTX 680, připravuje ještě výkonnější GPU, se mluvilo již koncem roku 2011. Loni ale zůstalo u GTX 680 a nejvýkonnější z první generace 28nm čipů s názvem GK110 vychází až nyní. Čipy GK104 a GK110 patří do jedné rodiny (Kepler) podobně jako například GF114 (GeForce GTX 560) a GF110 (GeForce GTX 580), ale stejně jako tyto jmenované se v několika architektonických prvcích liší.
Rozdíly jsou v některých ohledech menší (např. velikost SMX bloků), v jiných ohledech větší (např. rozsah podpory pro GPGPU/HPC), ale z globálního hlediska jde o tentýž přístup. Začněme proto základními parametry:
GeForce GTX 560 Ti | GeForce GTX 580 | GeForce GTX 680 | GeForce GTX Titan | |
---|---|---|---|---|
GPU |
Nvidia GF114 1,95 mld. tr. |
Nvidia GF110 3,00 mld. tr. |
Nvidia GK104 3,54 mld. tr. |
Nvidia GK110 7,1 mld. tr. |
Plocha jádra | 360 mm² | 520 mm² | 294 mm² | 551 mm² |
Výrobní proces | 40nm TSMC | 40nm TSMC | 28nm TSMC | 28nm TSMC |
Frekvence | 822 MHz | 772 MHz | 1006 MHz | 837 MHz |
Hot-clock | 1645 MHz | 1545 MHz | ||
Boost-clock | 1058 MHz | 876 MHz | ||
SPs (CUDA) | 384 | 512 | 1536 | 2688 |
TMUs | 64 | 64 | 128 | 224 |
ROPs | 32 | 48 | 32 | 48 |
Výkon (single precision) |
1,26 TFLOPS | 1,58 TFLOPS | 3,09 TFLOPS | 4,50 TFLOPS |
Výkon (double precision) |
0,10 TFLOPS | 0,20 TFLOPS | 0,13 TFLOPS | 1,30 TFLOPS (?) |
Paměti |
1 GB 256bit GDDR5 |
1,5-3 GB 384bit GDDR5 |
2 GB 256bit GDDR5 |
6 GB 384bit GDDR5 |
Frekvence pamětí | 4,0 GHz | 4,0 GHz | 6,0 GHz | 6,0 GHz |
Dat. propustnost | 128 GB/s | 192 GB/s | 192 GB/s | 288 GB/s |
Spotřeba ve 3D | 170 W | 244 W | 195 W | 250 W |
Napájení | 6+6-pin | 6+8-pin | 6+6-pin | 6+8-pin |
Výstupy |
2× DVI-I mini-HDMI 1.4a |
2× DVI-I mini-HDMI 1.4a |
DVI-I, DVI-D DisplayPort HDMI 1.4a |
DVI-I, DVI-D DisplayPort HDMI 1.4a |
Rozhraní | PCIe 2.0 ×16 | PCIe 2.0 ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 |
DirectX | 11 | 11 | 11 | 11 |
7,1 miliardami tranzistorů je Titan největší monolitické GPU, plochou se velmi těsně přiblížil ke GT200 / GeForce GTX 280, které však v tomto ohledu primát zůstává. Rozdíl oproti konkurenčnímu Radeonu HD 7970 (Tahiti) je 186 mm², oproti GeForce GTX 680 (GK104) pak 257 mm². Pro lepší srovnání jsme Titan zahrnuli do naší přehledové tabulky:
GPU | karta | rozměry | sběrnice |
---|---|---|---|
GT200 | GeForce GTX 280 | 576 mm² | 512bit |
GK110 | GeForce GTX Titan | 551 mm² | 384bit |
GF100 | GeForce GTX 480 | 529 mm² | 384bit |
G80 | GeForce 8800 GTX | 484 mm² | 384bit |
GT200b | GeForce GTX 285 | 470 mm² | 512bit |
R600 | Radeon HD 2900 XT | 420 mm² | 512bit |
Cayman | Radeon HD 6970 | 389 mm² | 256bit |
Tahiti | Radeon HD 7970 | 365 mm² | 384bit |
GF114 | GeForce GTX 560 Ti | 360 mm² | 256bit |
R580 | Radeon X1900 XTX | 342 mm² | 256bit |
Cypress | Radeon HD 5870 | 336 mm² | 256bit |
G92 | GeForce 9800 GTX | 334 mm² | 256bit |
G70 | GeForce 7800 GTX | 334 mm² | 256bit |
GK104 | GeForce GTX 680 | 294 mm² | 256bit |
R520 | Radeon X1800 XT | 288 mm² | 256bit |
NV40 | GeForce 6800 Ultra | 287 mm² | 256bit |
RV790 | Radeon HD 4890 | 282 mm² | 256bit |
R420 | Radeon X800 XT | 281 mm² | 256bit |
G92b | GeForce GTS 250 | 264 mm² | 256bit |
RV770 | Radeon HD 4870 | 256 mm² | 256bit |
R430 | Radeon X800 XL | 240 mm² | 256bit |
RV570 | Radeon X1950 PRO | 230 mm² | 256bit |
G94 | GeForce 9600 GT | 225 mm² | 256bit |
R300 | Radeon 9700 PRO | 218 mm² | 256bit |
GK106 | GeForce GTX 660 | 214 mm² | 192bit |
NV42 | GeForce 6800 GS | 213 mm² | 256bit |
Pitcairn | Radeon HD 7870 | 212 mm² | 256bit |
G71 | GeForce 7900 GTX | 196 mm² | 256bit |
RV670 | Radeon HD 3870 | 192 mm² | 256bit |
Pojďme se podívat, jak čip vypadá uvnitř:
Popsaný snímek jádra si neukazujeme poprvé. Přesto má jeho přítomnost pádný důvod. Čip sice obsahuje fyzicky 15 SMX bloků (zde číslováno od nuly), ale ani „Titan“ nemá aktivní všechny - jeden zůstává vypnutý. Zda se tak Nvidia rozhodla činit z důvodů výtěžnosti, spotřeby, nebo chce mít rezervu na „Titan 2.0“, nám známo není. Samozřejmě může jít i o mix všech jmenovaných důvodů.
Spíš pro zajímavost přikládáme i schématický diagram, který znázorňuje v podstatě totéž jako popsaný snímek jádra. Pokud jste všímaví, mohli jste postřehnout přítomnost jakýchsi žlutých jednotek v rámci každého SMX bloku...
Podíváme-li se na SMX blok detailněji, můžeme si všimnout, že nese fyzické DP (double-precision) jednotky. To je poměrně zajímavá změna. Nvidia samostatné DP jednotky předvedla poprvé na čipu GT200 (GeForce GTX 280), ale pak od nich upustila. Generace Fermi k double-precision výpočtům používala single-precision jednotky, které tyto výpočty zvládaly v nižší rychlosti. S GK104 / GeForce GTX 680 nebyla situace zcela jasná, na tiskové prezentaci v San Franciscu nechtěla Nvidia toto téma komentovat. Novináři s přímými kontakty na zaměstnance pak podávali dva podstatně odlišné výklady: Podle jednoho je část SP jednotek čipu GK104 schopna provádět double-precision výpočty, podle druhého obsahuje každý SMX blok GK104 osm samostatných double-precision jednotek. V případě GK110 je však přítomnost samostatných DP jednotek oficiálně potvrzena.
Podstatné jsou dvě informace: GK110 obsahuje 1 DP jednotku na 3 SP, poměr je tedy 1:3. Při DP výpočtech dále GeForce GTX Titan nezvyšuje frekvenci, běží na základních 837 MHz. Přesto jedna nesrovnalost zůstává: Kombinací 869 DP jednotek běžících na 837 MHz by mělo být dosaženo výkonu 1,5 TFLOPS. Materiály Nvidie ale opakovaně udávají hodnotu 1,3 TFLOPS. Zda jde o opakovaný překlep (či copy/paste error), nebo je výkon něčím limitován, zatím není jasné.