GeForce GTX 460 1GB - DirectX 11 nástupce legendární 8800 GT v prvních testech!
Kapitoly článků
Než si ale představíme testovací kartu, podívejme se společně, jaké jsou parametry GeForce GTX 460 a jaké změny v GPU Nvidia udělala oproti kartám s GF100.
|
GTX 460 nese nejméně CUDA jednotek ze všech karet. I díky tomu je její GPU velmi malé, spotřeba znatelně nižší oproti ostatní Fermi grafikám, ale jsou to změny v architektuře, které zapříčiňuji, že ani tak se GTX 460 neztratí, spíše naopak.
Architektura GF104 může na první pohled vypadat podobně jako GF100, ale povšimněte si odlišného poměru jednotlivých prvků v GPU. Zatímco GF100 má 32 CUDA jader, GF104 jich nese 48 na jeden výpočetní blok. Stejně je tomu i s texturovacími jednotkami.
Vlevo architektura GF100 SM, vpravo GF104 SM
Porovnáme-li si SM bloky, pak GF100 nese dvě dispatch jednotky, zatímco GF104 čtyři, registrová část není jen 4k ×32bit, ale rovnou 32k ×32bit, taktéž samotná CUDA jádra mají zdvojené Dispatch porty (což je logické s ohledem na počet jednotek mimo CUDA jádra). Celkově na úrovni warpu umí GF104 dvě instrukce za takt, zatímco GF100 "jen" jednu. Ne že by to dávalo architektuře dvojnásobek výkonu, to samozřejmě ne, ale je to benefit pro jisté situace, které se netýkají ani tak GPGPU, jako právě herního/3D využití, na které je GF104, na rozdíl od GF100, cíleno.
GTX 460 má sedm exekučních clusterů běžících na základní frekvenci GPU - tři po 16 CUDA jádrech (každé s FP - plovoucí čárka - a INT - pevná čárka - exekučními jednotkami), jeden LD/ST (load/store) cluster, jeden texturovací cluster a též po jedné jednotce pro speciální funkce (Special Function Unit) a jedné interpolační. Až čtyři instrukce mohou běžet na každém z těchto clusterů, pokud již není zaměstnán výpočty z předchozích operací. FP a INT trasy mají své oddělené zdroje, aby tak mohly vykonávat například tři FP plus jednu INT instrukci na jeden takt scheduleru.
Převedeno ze "Star-Trekštiny" do srozumitelnější řeči: oproti GF100 zacvičila Nvidia v GF104 s poměrem jednotek tak, aby více vyhovoval očekávanému poměru využití jednotlivých technik z DirectX11/OpenGL4.0 ve hrách, než je tomu o GF100. Byla odstraněna jistá pro herní grafiku nepotřebná logika (mimo jiné nepochybně ta, která způsobuje, že GTX 460 má oproti GTX 465/470/480 poloviční výkon v double-precision oproti single-precision výpočtech) a dané místo využito pro zvýšení počtu potřebných jednotek, aniž by bylo nutné zvětšovat GPU (resp. si to můžeme vyložit tak, že GPU bylo uspořádáno jinak a současně tak, aby jeho rozměry byly velmi malé).
Pro GPGPU nadšence se sluší dodat další rozdíl mezi 768 a 1024MB verzí, který samozřejmě souvisí se šířkou sběrnice: 768MB verze má 384 kB L2 cache, 1GB verze pak 512 kB L2 cache. Dále dodejme, že mezní teplota pro GPU je 104 °C, ale k té se vlastně nikdy nedostanete (pokud PC nebudete provozvat v troubě, nebo vysoké peci apod.).
Nakolik se tato karta trefí do jemných nuancí apetitu herních engine nadcházejících let, to samozřejmě dnes nemůže zcela exaktně říci nikdo, ono ani Radeony HD 5800 na tom nejsou dokonale (jsou chvíle, kdy je v zásadě jedno, máte-li 1600sp HD 5870, nebo 1440sp HD 5850, protože pro ten specifický engine je brzdou v GPU něco jiného než výpočetní jádra), ale snad vám naše obvyklá sada herních a benchmarkových testů zahrnující mimo jiné DirectX 11 a tesselaci dá dobrý náhled.
|