Diit.cz - Novinky a informace o hardware, software a internetu

GeForce GTX 460 1GB - DirectX 11 nástupce legendární 8800 GT v prvních testech!

Zotac GeForce GTX 460: obsah balení
Přiznejme si, že na opravdovou pořádnou grafiku od Nvidie, která by navázala na skvělou pověst GPU G92 a GeForce 8800 GT, jsme čekali celkem dlouho. Nvidia sama pasuje GeForce GTX 460 na pozici morálního nástupce modelu 8800 GT, takže jsme se samozřejmě rozhodli prozkoumat, je-li tomu opravdu tak nebo ne. Jak si GTX 460 vede nejen oproti GTX 465, 470 a 480, ale také proti Radeonům HD 5000, na to si odpovíme na následujících stránkách.

Než si ale představíme testovací kartu, podívejme se společně, jaké jsou parametry GeForce GTX 460 a jaké změny v GPU Nvidia udělala oproti kartám s GF100.

  GeForce GTX 460
768 MB
GeForce GTX 460
1 GB
GeForce GTX 465 GeForce GTX 470 GeForce GTX 480
GPU GF104, 40nm TSMC
1,95 mld.tr.
GF104, 40nm TSMC
1,95 mld.tr.
GF100, 40nm TSMC
3,2 mld.tr.
GF100, 40nm TSMC
3,2 mld.tr.
GF100, 40nm TSMC
3,2 mld.tr.
Frekvence 675 MHz 675 MHz 607 MHz 607 MHz 700 MHz
CUDA jader 336 336 352 448 480
TMU 56 56 44 56 60
ROP 24 32 32 40 48
Frekvence CUDA jader 1 350 MHz 1 350 MHz 1 215 MHz 1 215 MHz 1 401 MHz
Výkon (single precision) - - 855 GFLOPs 1 089 GFLOPs 1 345 GFLOPs
Paměti 768 MB, 192bit GDDR5 1,0 GB, 256bit GDDR5 1,0 GB, 256bit GDDR5 1,25 GB, 320bit GDDR5 1,5 GB, 384bit GDDR5
Frekvence pamětí 3 600 MHz 3 600 MHz 3 206 MHz 3 348 MHz 3 696 MHz
Maximální spotřeba 150 W 160 W 200 W 215 W 250 W

 

GTX 460 nese nejméně CUDA jednotek ze všech karet. I díky tomu je její GPU velmi malé, spotřeba znatelně nižší oproti ostatní Fermi grafikám, ale jsou to změny v architektuře, které zapříčiňuji, že ani tak se GTX 460 neztratí, spíše naopak.

GeForce GTX 460: architektura, versus GTX 480

Architektura GF104 může na první pohled vypadat podobně jako GF100, ale povšimněte si odlišného poměru jednotlivých prvků v GPU. Zatímco GF100 má 32 CUDA jader, GF104 jich nese 48 na jeden výpočetní blok. Stejně je tomu i s texturovacími jednotkami.

Nvidia představila Fermi: architektura SM GeForce GTX 460: architektura GPU podrobně

Vlevo architektura GF100 SM, vpravo GF104 SM

Porovnáme-li si SM bloky, pak GF100 nese dvě dispatch jednotky, zatímco GF104 čtyři, registrová část není jen 4k ×32bit, ale rovnou 32k ×32bit, taktéž samotná CUDA jádra mají zdvojené Dispatch porty (což je logické s ohledem na počet jednotek mimo CUDA jádra). Celkově na úrovni warpu umí GF104 dvě instrukce za takt, zatímco GF100 "jen" jednu. Ne že by to dávalo architektuře dvojnásobek výkonu, to samozřejmě ne, ale je to benefit pro jisté situace, které se netýkají ani tak GPGPU, jako právě herního/3D využití, na které je GF104, na rozdíl od GF100, cíleno.

GTX 460 má sedm exekučních clusterů běžících na základní frekvenci GPU - tři po 16 CUDA jádrech (každé s FP - plovoucí čárka - a INT - pevná čárka - exekučními jednotkami), jeden LD/ST (load/store) cluster, jeden texturovací cluster a též po jedné jednotce pro speciální funkce (Special Function Unit) a jedné interpolační. Až čtyři instrukce mohou běžet na každém z těchto clusterů, pokud již není zaměstnán výpočty z předchozích operací. FP a INT trasy mají své oddělené zdroje, aby tak mohly vykonávat například tři FP plus jednu INT instrukci na jeden takt scheduleru.

Převedeno ze "Star-Trekštiny" do srozumitelnější řeči: oproti GF100 zacvičila Nvidia v GF104 s poměrem jednotek tak, aby více vyhovoval očekávanému poměru využití jednotlivých technik z DirectX11/OpenGL4.0 ve hrách, než je tomu o GF100. Byla odstraněna jistá pro herní grafiku nepotřebná logika (mimo jiné nepochybně ta, která způsobuje, že GTX 460 má oproti GTX 465/470/480 poloviční výkon v double-precision oproti single-precision výpočtech) a dané místo využito pro zvýšení počtu potřebných jednotek, aniž by bylo nutné zvětšovat GPU (resp. si to můžeme vyložit tak, že GPU bylo uspořádáno jinak a současně tak, aby jeho rozměry byly velmi malé).

Pro GPGPU nadšence se sluší dodat další rozdíl mezi 768 a 1024MB verzí, který samozřejmě souvisí se šířkou sběrnice: 768MB verze má 384 kB L2 cache, 1GB verze pak 512 kB L2 cache. Dále dodejme, že mezní teplota pro GPU je 104 °C, ale k té se vlastně nikdy nedostanete (pokud PC nebudete provozvat v troubě, nebo vysoké peci apod.).

Nakolik se tato karta trefí do jemných nuancí apetitu herních engine nadcházejících let, to samozřejmě dnes nemůže zcela exaktně říci nikdo, ono ani Radeony HD 5800 na tom nejsou dokonale (jsou chvíle, kdy je v zásadě jedno, máte-li 1600sp HD 5870, nebo 1440sp HD 5850, protože pro ten specifický engine je brzdou v GPU něco jiného než výpočetní jádra), ale snad vám naše obvyklá sada herních a benchmarkových testů zahrnující mimo jiné DirectX 11 a tesselaci dá dobrý náhled.

Přečtěte si také:
GeForce GTX 465, obsah balení Asus Test: GeForce GTX 465 - nejnižší Nvidia Fermi na trhu

Tagy: 

David Ježek

Dlouholetý zdejší redaktor (2005-2017), příznivec open-source rád píšící i o ne-IT tématech. Odpůrce sw patentů a omezování občanských svobod ve prospěch korporací. Fanoušek Asimova, Kinga, Feynmana, Sudka, 70mm filmu, sf/vf filmu, Fomapanu 400, starých dobrých her, 99% čokolády, indické kuchyně, domácího kváskového chleba a řady dalších věcí.

více článků, blogů a informací o autorovi

Diskuse ke článku GeForce GTX 460 1GB - DirectX 11 nástupce legendární 8800 GT v prvních testech!

Úterý, 20 Červenec 2010 - 12:59 | bomberman | Nema niekto skusenosti s pretaktovanymi kartami...
Pondělí, 19 Červenec 2010 - 08:26 | vesos | Cheche ... stačí si přečíst některé vaše reakce...
Pátek, 16 Červenec 2010 - 08:14 | jasomtu | No když to tady tak čtu tak NV460 pěkně vytáčí...
Čtvrtek, 15 Červenec 2010 - 09:19 | nereus | Tak nejak vnutri mi nieco hovori, ze keby malo...
Středa, 14 Červenec 2010 - 20:45 | DigitalDoom | PS: Takže když teď, stejně jako vy, začnu všude...
Středa, 14 Červenec 2010 - 20:34 | DigitalDoom | Víte on je rozdíl mezi tím, strávit jiný názor a...
Středa, 14 Červenec 2010 - 20:31 | DigitalDoom | Nevycházím z údivu ... takže vy mě urazíte,...
Středa, 14 Červenec 2010 - 12:05 | WIFT | Tím, že jste na mou narážku takto zareagoval,...
Středa, 14 Červenec 2010 - 11:29 | terrorist | herni segment je pro ne zcela jiste prioritou,...
Středa, 14 Červenec 2010 - 10:48 | xvasek | OK. Jestli to nVidia vidí tak, že herní segment...

Zobrazit diskusi