Velký rozbor: Nvidia GeForce GTX Titan - karta postavená pro recenze?

22. 2. 2013 | no-X | Grafiky, Novinky, Hardware

Nvidia tento týden „na pokračování“ vydala grafickou kartu GeForce GTX Titan. V první vlně směli novináři informovat de facto o pozitivech, ve druhé si navnadění čtenáři mohli přečíst i to ostatní…

Kapitoly článků

1. Architektura a parametry

2. GPU Boost 2.0 a spotřeba

3. Výkon

4. Cena a hodnocení

O tom, že Nvidia kromě čipu GK104 uvedeného v rámci GeForce GTX 680, připravuje ještě výkonnější GPU, se mluvilo již koncem roku 2011. Loni ale zůstalo u GTX 680 a nejvýkonnější z první generace 28nm čipů s názvem GK110 vychází až nyní. Čipy GK104 a GK110 patří do jedné rodiny (Kepler) podobně jako například GF114 (GeForce GTX 560) a GF110 (GeForce GTX 580), ale stejně jako tyto jmenované se v několika architektonických prvcích liší.

GeForce GTX Titan bez chladiče, GPU GK110 (Anandtech)

Rozdíly jsou v některých ohledech menší (např. velikost SMX bloků), v jiných ohledech větší (např. rozsah podpory pro GPGPU/HPC), ale z globálního hlediska jde o tentýž přístup. Začněme proto základními parametry:

	GeForce GTX 560 Ti	GeForce GTX 580	GeForce GTX 680	GeForce GTX Titan
GPU	Nvidia GF114 1,95 mld. tr.	Nvidia GF110 3,00 mld. tr.	Nvidia GK104 3,54 mld. tr.	Nvidia GK110 7,1 mld. tr.
Plocha jádra	360 mm²	520 mm²	294 mm²	551 mm²
Výrobní proces	40nm TSMC	40nm TSMC	28nm TSMC	28nm TSMC
Frekvence	822 MHz	772 MHz	1006 MHz	837 MHz
Hot-clock	1645 MHz	1545 MHz
Boost-clock			1058 MHz	876 MHz
SPs (CUDA)	384	512	1536	2688
TMUs	64	64	128	224
ROPs	32	48	32	48
Výkon (single precision)	1,26 TFLOPS	1,58 TFLOPS	3,09 TFLOPS	4,50 TFLOPS
Výkon (double precision)	0,10 TFLOPS	0,20 TFLOPS	0,13 TFLOPS	1,30 TFLOPS (?)
Paměti	1 GB 256bit GDDR5	1,5-3 GB 384bit GDDR5	2 GB 256bit GDDR5	6 GB 384bit GDDR5
Frekvence pamětí	4,0 GHz	4,0 GHz	6,0 GHz	6,0 GHz
Dat. propustnost	128 GB/s	192 GB/s	192 GB/s	288 GB/s
Spotřeba ve 3D	170 W	244 W	195 W	250 W
Napájení	6+6-pin	6+8-pin	6+6-pin	6+8-pin
Výstupy	2× DVI-I mini-HDMI 1.4a	2× DVI-I mini-HDMI 1.4a	DVI-I, DVI-D DisplayPort HDMI 1.4a	DVI-I, DVI-D DisplayPort HDMI 1.4a
Rozhraní	PCIe 2.0 ×16	PCIe 2.0 ×16	PCIe 3.0 ×16	PCIe 3.0 ×16
DirectX	11	11	11	11

7,1 miliardami tranzistorů je Titan největší monolitické GPU, plochou se velmi těsně přiblížil ke GT200 / GeForce GTX 280, které však v tomto ohledu primát zůstává. Rozdíl oproti konkurenčnímu Radeonu HD 7970 (Tahiti) je 186 mm², oproti GeForce GTX 680 (GK104) pak 257 mm². Pro lepší srovnání jsme Titan zahrnuli do naší přehledové tabulky:

GPU	karta	rozměry	sběrnice
GT200	GeForce GTX 280	576 mm²	512bit
GK110	GeForce GTX Titan	551 mm²	384bit
GF100	GeForce GTX 480	529 mm²	384bit
G80	GeForce 8800 GTX	484 mm²	384bit
GT200b	GeForce GTX 285	470 mm²	512bit
R600	Radeon HD 2900 XT	420 mm²	512bit
Cayman	Radeon HD 6970	389 mm²	256bit
Tahiti	Radeon HD 7970	365 mm²	384bit
GF114	GeForce GTX 560 Ti	360 mm²	256bit
R580	Radeon X1900 XTX	342 mm²	256bit
Cypress	Radeon HD 5870	336 mm²	256bit
G92	GeForce 9800 GTX	334 mm²	256bit
G70	GeForce 7800 GTX	334 mm²	256bit
GK104	GeForce GTX 680	294 mm²	256bit
R520	Radeon X1800 XT	288 mm²	256bit
NV40	GeForce 6800 Ultra	287 mm²	256bit
RV790	Radeon HD 4890	282 mm²	256bit
R420	Radeon X800 XT	281 mm²	256bit
G92b	GeForce GTS 250	264 mm²	256bit
RV770	Radeon HD 4870	256 mm²	256bit
R430	Radeon X800 XL	240 mm²	256bit
RV570	Radeon X1950 PRO	230 mm²	256bit
G94	GeForce 9600 GT	225 mm²	256bit
R300	Radeon 9700 PRO	218 mm²	256bit
GK106	GeForce GTX 660	214 mm²	192bit
NV42	GeForce 6800 GS	213 mm²	256bit
Pitcairn	Radeon HD 7870	212 mm²	256bit
G71	GeForce 7900 GTX	196 mm²	256bit
RV670	Radeon HD 3870	192 mm²	256bit

Pojďme se podívat, jak čip vypadá uvnitř:

Nvidia Kepler GK110 - dieshot

Popsaný snímek jádra si neukazujeme poprvé. Přesto má jeho přítomnost pádný důvod. Čip sice obsahuje fyzicky 15 SMX bloků (zde číslováno od nuly), ale ani „Titan“ nemá aktivní všechny - jeden zůstává vypnutý. Zda se tak Nvidia rozhodla činit z důvodů výtěžnosti, spotřeby, nebo chce mít rezervu na „Titan 2.0“, nám známo není. Samozřejmě může jít i o mix všech jmenovaných důvodů.

Spíš pro zajímavost přikládáme i schématický diagram, který znázorňuje v podstatě totéž jako popsaný snímek jádra. Pokud jste všímaví, mohli jste postřehnout přítomnost jakýchsi žlutých jednotek v rámci každého SMX bloku...

SMX blok Nvidia GK110 - GeForce GTX Titan

Podíváme-li se na SMX blok detailněji, můžeme si všimnout, že nese fyzické DP (double-precision) jednotky. To je poměrně zajímavá změna. Nvidia samostatné DP jednotky předvedla poprvé na čipu GT200 (GeForce GTX 280), ale pak od nich upustila. Generace Fermi k double-precision výpočtům používala single-precision jednotky, které tyto výpočty zvládaly v nižší rychlosti. S GK104 / GeForce GTX 680 nebyla situace zcela jasná, na tiskové prezentaci v San Franciscu nechtěla Nvidia toto téma komentovat. Novináři s přímými kontakty na zaměstnance pak podávali dva podstatně odlišné výklady: Podle jednoho je část SP jednotek čipu GK104 schopna provádět double-precision výpočty, podle druhého obsahuje každý SMX blok GK104 osm samostatných double-precision jednotek. V případě GK110 je však přítomnost samostatných DP jednotek oficiálně potvrzena.

Podstatné jsou dvě informace: GK110 obsahuje 1 DP jednotku na 3 SP, poměr je tedy 1:3. Při DP výpočtech dále GeForce GTX Titan nezvyšuje frekvenci, běží na základních 837 MHz. Přesto jedna nesrovnalost zůstává: Kombinací 869 DP jednotek běžících na 837 MHz by mělo být dosaženo výkonu 1,5 TFLOPS. Materiály Nvidie ale opakovaně udávají hodnotu 1,3 TFLOPS. Zda jde o opakovaný překlep (či copy/paste error), nebo je výkon něčím limitován, zatím není jasné.

Tagy:

Nvidia, GeForce, Kepler, GK110, GTX Titan

Zdroje:

ComputerBase, TechPowerUp, Anandtech, TechPowerUp, TechReport, HardOCP

nahlásit chybu

následující kapitola

GPU Boost 2.0 a spotřeba »

Kapitoly článků

1. Architektura a parametry

2. GPU Boost 2.0 a spotřeba

3. Výkon

4. Cena a hodnocení

Jiří "no-X" Souček

více článků, blogů a informací o autorovi

Diskuse ke článku Velký rozbor: Nvidia GeForce GTX Titan - karta postavená pro recenze?

Pátek, 1 Březen 2013 - 20:52 | Heron | Tohle vysvětlení dává smysl, ovšem chybu bych...

Čtvrtek, 28 Únor 2013 - 16:47 | spc | ach jaj - realita ma vzdy len jednu vetvu, t.j....

Středa, 27 Únor 2013 - 04:11 | Richmond | Aha, takže vlastně celé tohle bylo z tvé strany...

Úterý, 26 Únor 2013 - 20:28 | spc | clovece navstiv prosim ta doktora - teda ak si...

Úterý, 26 Únor 2013 - 12:40 | zva | Už jsem se chystal, že něco podopného napíšu, ale...

Úterý, 26 Únor 2013 - 08:23 | Richmond | Podle mě nejen v grafice. Dovedu si představit...

Úterý, 26 Únor 2013 - 08:18 | Richmond | Jak jsi na tohle přišel???????????????????????...

Úterý, 26 Únor 2013 - 03:39 | Richmond | Pamatuju se když jsem za podobné peníze kupoval...

Pondělí, 25 Únor 2013 - 19:38 | spc | seeefko - treba sa najprv naucit PORIADNE CITAT...

Pondělí, 25 Únor 2013 - 19:22 | Richmond | Vidíš, já jí kupoval pro zákoše za 23k (přišla ze...

Zobrazit diskusi

Diit.cz - Novinky a informace o hardware, software a internetu

Velký rozbor: Nvidia GeForce GTX Titan - karta postavená pro recenze?

Kapitoly článků

Jiří "no-X" Souček

Diskuse ke článku Velký rozbor: Nvidia GeForce GTX Titan - karta postavená pro recenze?

Komerční sdělení

CDR Hry

Útok roku 2025: Hackeři tvrdí, že získali miliardu dat ze Salesforce

Signal varuje: Návrh EU Chat Control se chová jako malware

Umělý neuron z bakterií mluví řečí lidského mozku

LinkedIn podává žalobu: Miliony falešných účtů měly krást data

Váš router potřebuje péči. Takhle ho udržíte chráněný a rychlý

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT