Diit.cz - Novinky a informace o hardware, software a internetu

Velký rozbor: Nvidia GeForce GTX Titan - karta postavená pro recenze?

3x Titan TechPowerUp
Nvidia tento týden „na pokračování“ vydala grafickou kartu GeForce GTX Titan. V první vlně směli novináři informovat de facto o pozitivech, ve druhé si navnadění čtenáři mohli přečíst i to ostatní…

Kapitoly článků

1.  Architektura a parametry
3.  Výkon

O tom, že Nvidia kromě čipu GK104 uvedeného v rámci GeForce GTX 680, připravuje ještě výkonnější GPU, se mluvilo již koncem roku 2011. Loni ale zůstalo u GTX 680 a nejvýkonnější z první generace 28nm čipů s názvem GK110 vychází až nyní. Čipy GK104 a GK110 patří do jedné rodiny (Kepler) podobně jako například GF114 (GeForce GTX 560) a GF110 (GeForce GTX 580), ale stejně jako tyto jmenované se v několika architektonických prvcích liší.

GeForce GTX Titan Anandtech
GeForce GTX Titan bez chladiče, GPU GK110 (Anandtech)

Rozdíly jsou v některých ohledech menší (např. velikost SMX bloků), v jiných ohledech větší (např. rozsah podpory pro GPGPU/HPC), ale z globálního hlediska jde o tentýž přístup. Začněme proto základními parametry:

  GeForce GTX 560 Ti GeForce GTX 580 GeForce GTX 680 GeForce GTX Titan
GPU Nvidia GF114
1,95 mld. tr.
Nvidia GF110
3,00 mld. tr.
Nvidia GK104
3,54 mld. tr.
Nvidia GK110
7,1 mld. tr.
Plocha jádra 360 mm² 520 mm² 294 mm² 551 mm²
Výrobní proces 40nm TSMC 40nm TSMC 28nm TSMC 28nm TSMC
Frekvence 822 MHz 772 MHz 1006 MHz 837 MHz
Hot-clock 1645 MHz 1545 MHz
Boost-clock 1058 MHz 876 MHz
SPs (CUDA) 384 512 1536 2688
TMUs 64 64 128 224
ROPs 32 48 32 48
Výkon
(single precision)
1,26  TFLOPS 1,58 TFLOPS 3,09 TFLOPS 4,50 TFLOPS
Výkon
(double precision)
0,10 TFLOPS 0,20 TFLOPS 0,13 TFLOPS 1,30 TFLOPS (?)
Paměti 1 GB
256bit GDDR5
1,5-3 GB
384bit GDDR5
2 GB
256bit GDDR5
6 GB
384bit GDDR5
Frekvence pamětí 4,0 GHz 4,0 GHz 6,0 GHz 6,0 GHz
Dat. propustnost 128 GB/s 192 GB/s 192 GB/s 288 GB/s
Spotřeba ve 3D 170 W 244 W 195 W 250 W
Napájení 6+6-pin 6+8-pin 6+6-pin 6+8-pin
Výstupy 2× DVI-I
mini-HDMI 1.4a
2× DVI-I
mini-HDMI 1.4a
DVI-I, DVI-D
DisplayPort
HDMI 1.4a
DVI-I, DVI-D
DisplayPort
HDMI 1.4a
Rozhraní PCIe 2.0 ×16 PCIe 2.0 ×16 PCIe 3.0 ×16 PCIe 3.0 ×16
DirectX 11 11 11 11

7,1 miliardami tranzistorů je Titan největší monolitické GPU, plochou se velmi těsně přiblížil ke GT200 / GeForce GTX 280, které však v tomto ohledu primát zůstává. Rozdíl oproti konkurenčnímu Radeonu HD 7970 (Tahiti) je 186 mm², oproti GeForce GTX 680 (GK104) pak 257 mm². Pro lepší srovnání jsme Titan zahrnuli do naší přehledové tabulky:

GPU karta rozměry sběrnice
GT200 GeForce GTX 280 576 mm² 512bit
GK110 GeForce GTX Titan 551 mm² 384bit
GF100 GeForce GTX 480 529 mm² 384bit
G80 GeForce 8800 GTX 484 mm² 384bit
GT200b GeForce GTX 285 470 mm² 512bit
R600 Radeon HD 2900 XT 420 mm² 512bit
Cayman Radeon HD 6970 389 mm² 256bit
Tahiti Radeon HD 7970 365 mm² 384bit
GF114 GeForce GTX 560 Ti 360 mm² 256bit
R580 Radeon X1900 XTX 342 mm² 256bit
Cypress Radeon HD 5870 336 mm² 256bit
G92 GeForce 9800 GTX 334 mm² 256bit
G70 GeForce 7800 GTX 334 mm² 256bit
GK104 GeForce GTX 680 294 mm² 256bit
R520 Radeon X1800 XT 288 mm² 256bit
NV40 GeForce 6800 Ultra 287 mm² 256bit
RV790 Radeon HD 4890 282 mm² 256bit
R420 Radeon X800 XT 281 mm² 256bit
G92b GeForce GTS 250 264 mm² 256bit
RV770 Radeon HD 4870 256 mm² 256bit
R430 Radeon X800 XL 240 mm² 256bit
RV570 Radeon X1950 PRO 230 mm² 256bit
G94 GeForce 9600 GT 225 mm² 256bit
R300 Radeon 9700 PRO 218 mm² 256bit
GK106 GeForce GTX 660 214 mm² 192bit
NV42 GeForce 6800 GS 213 mm² 256bit
Pitcairn Radeon HD 7870 212 mm² 256bit
G71 GeForce 7900 GTX 196 mm² 256bit
RV670 Radeon HD 3870 192 mm² 256bit

Pojďme se podívat, jak čip vypadá uvnitř: 

Nvidia Kepler GK110 dieshot
Nvidia Kepler GK110 - dieshot

Popsaný snímek jádra si neukazujeme poprvé. Přesto má jeho přítomnost pádný důvod. Čip sice obsahuje fyzicky 15 SMX bloků (zde číslováno od nuly), ale ani „Titan“ nemá aktivní všechny - jeden zůstává vypnutý. Zda se tak Nvidia rozhodla činit z důvodů výtěžnosti, spotřeby, nebo chce mít rezervu na „Titan 2.0“, nám známo není. Samozřejmě může jít i o mix všech jmenovaných důvodů.

Nvidia GK110 GeForce GTX Titan

Spíš pro zajímavost přikládáme i schématický diagram, který znázorňuje v podstatě totéž jako popsaný snímek jádra. Pokud jste všímaví, mohli jste postřehnout přítomnost jakýchsi žlutých jednotek v rámci každého SMX bloku...

Nvidia GK110 GeForce GTX Titan SMX blok
SMX blok Nvidia GK110 - GeForce GTX Titan

Podíváme-li se na SMX blok detailněji, můžeme si všimnout, že nese fyzické DP (double-precision) jednotky. To je poměrně zajímavá změna. Nvidia samostatné DP jednotky předvedla poprvé na čipu GT200 (GeForce GTX 280), ale pak od nich upustila. Generace Fermi k double-precision výpočtům používala single-precision jednotky, které tyto výpočty zvládaly v nižší rychlosti. S GK104 / GeForce GTX 680 nebyla situace zcela jasná, na tiskové prezentaci v San Franciscu nechtěla Nvidia toto téma komentovat. Novináři s přímými kontakty na zaměstnance pak podávali dva podstatně odlišné výklady: Podle jednoho je část SP jednotek čipu GK104 schopna provádět double-precision výpočty, podle druhého obsahuje každý SMX blok GK104 osm samostatných double-precision jednotek. V případě GK110 je však přítomnost samostatných DP jednotek oficiálně potvrzena.

Podstatné jsou dvě informace: GK110 obsahuje 1 DP jednotku na 3 SP, poměr je tedy 1:3. Při DP výpočtech dále GeForce GTX Titan nezvyšuje frekvenci, běží na základních 837 MHz. Přesto jedna nesrovnalost zůstává: Kombinací 869 DP jednotek běžících na 837 MHz by mělo být dosaženo výkonu 1,5 TFLOPS. Materiály Nvidie ale opakovaně udávají hodnotu 1,3 TFLOPS. Zda jde o opakovaný překlep (či copy/paste error), nebo je výkon něčím limitován, zatím není jasné.

Kapitoly článků
1.  Architektura a parametry
3.  Výkon

Diskuse ke článku Velký rozbor: Nvidia GeForce GTX Titan - karta postavená pro recenze?

Pátek, 1 Březen 2013 - 20:52 | Heron | Tohle vysvětlení dává smysl, ovšem chybu bych...
Čtvrtek, 28 Únor 2013 - 16:47 | spc | ach jaj - realita ma vzdy len jednu vetvu, t.j....
Středa, 27 Únor 2013 - 04:11 | Richmond | Aha, takže vlastně celé tohle bylo z tvé strany...
Úterý, 26 Únor 2013 - 20:28 | spc | clovece navstiv prosim ta doktora - teda ak si...
Úterý, 26 Únor 2013 - 12:40 | zva | Už jsem se chystal, že něco podopného napíšu, ale...
Úterý, 26 Únor 2013 - 08:23 | Richmond | Podle mě nejen v grafice. Dovedu si představit...
Úterý, 26 Únor 2013 - 08:18 | Richmond | Jak jsi na tohle přišel???????????????????????...
Úterý, 26 Únor 2013 - 03:39 | Richmond | Pamatuju se když jsem za podobné peníze kupoval...
Pondělí, 25 Únor 2013 - 19:38 | spc | seeefko - treba sa najprv naucit PORIADNE CITAT...
Pondělí, 25 Únor 2013 - 19:22 | Richmond | Vidíš, já jí kupoval pro zákoše za 23k (přišla ze...

Zobrazit diskusi