Technologické novinky
Kapitoly článků
Krátce se ještě zastavme u výroby GPU G80. Na jednu stranu se může zdát celkových 681 miliónů tranzistorů vyráběných „konzervativním“ 90nm procesem poněkud mnoho na jeden čip, nicméně zas takový problém to není a to hned díky několika „kompenzačním“ aspektům. Zaprvé „základní“ frekvence GPU 500, resp. 575 MHz není nijak vysoká, i čipy s tak mnoha tranzistory, které však mají běžet na takto nízkých frekvencích, zjevně v TSMC umějí s přijatelnou výtěžností. Vše další pak kompenzuje velmi kvalitní chlazení, počínaje heat-spreaderem (ne nepodobným tomu na dnešních procesorech) a vskutku masivním chladičem karty. Pracovní frekvence například stream procesorů se sice může zdát vysoká, ale shadery rozhodně nezabírají celé GPU. Jen si zbývá připomenout, že nVidia nepovoluje u GeForce 8800 řady výrobcům karet prodej žádných modelů běžících na vyšších než stanovených frekvencích, ale i tak bude postupem času zajímavé sledovat, kam až se overclockeři dostanou (během prvních dnů/týdnů čekejte tradiční smršť nových rekordů v 3D Marku 06 vytvořených pomocí tekutého dusíku :-).
Unifikovaná architektura
Gigathread
Schopnosti paralelního zpracování dat v G80 označuje nVidia pojmem „Gigathread technology“, který jasně napovídá, co je tím míněno. Jednoduše schopnost zpracovávat paralelně vysoké množství výpočtů (materiály nVidie mluví v řádu stovek až tisíců, připomeňme však, že stream procesorů je v GTX verzi „jen“ 128).
CUDA
Compute Unified Device Architecture alias CUDA je pak názvem samotné architektury. CUDA umožňuje jednotlivým vláknům (threadům) v GPU mezi sebou komunikovat. K dispozici je kompletní vývojářský kit (SDK) využívající standardní programovací jazyk C včetně optimalizovaného kompilátoru a také hardwarový debugging. K dispozici jsou předdefinované standardni matematicke funkce v knihovnách a samozřejmě v dobrém duchu firmy ovladače nejen pro Windows, ale i Linux. Vývojáři mohou pro low-level psaní aplikací využívat i takzvaný „nVidia assembly for computing“ (NVasc).
CUDA umí při výpočtu (stejně jako ATI v R520/580) štěpit delší a složitější výpočty na kratší a ty předávat stream procesorům ke zpracování paralelně. Vše řídí zmiňovaný Thread Execution Manager. Výpočetní data stream procesorů mohou využívat sdílenou cache.
Stream procesory jsou v G80 seskupeny v blocích. Těm přísluší vždy sada Texture Filtering a Texture Adress jednotek s L1 a L2 cache.
Lumenex engine
Lumenex engine označuje soubor technologií sloužících k dosažení co nejvyšší kvality zobrazení. Zahrnují:
Coverage Sampling AntiAlliasing
CSAA je novou metodou antialiasingu, kterou naleznete v G80. nVidia uvádí, že výkonově je na tom podobně jako 4× až 8× MSAA (MultiSampling AA uvedený v G70), přičemž nabízí režimy 8×, 16× a 16×Q. Čtvrtý nový v pořadí je „klasický původní“ 8× MSAA, který nese označení 8×Q. Nové režimy lze aktivovat ve Forceware ovladačích pomocí volby „Enhance the Apllication Setting“. Srovnání dle nVidie výkonově odpovídajících 4×MSAA a 16×CSAA vídíte na následujícím obrázku. My snad zatím jen dodejme, že si v tomto spíše počkáme na testy nezávislých serverů.
Anisotropní filtrování
I anisotropní filtrování prochází v GeForce 8800 evolučním vývojem. Na úvod si jen připomeňme naše vlastní měření tohoto aspektu renderingu, při kterém jsme porovnávali úhlové optimalizace při různých AF režimech na GeForce 7300 LE a Radeonech X1300 a X1300 Pro. nVidia ve svých materiálech uvádí srovnání mezi GeForce 7 a 8 generací, kde vidíte odpovídající masivní úhlové optimalizace na stávající 7. generaci, zatímco GeForce 8800 jsou jich takřka prosty.
Oddělení filtrace textur od stream procesorů ve svém důsledku vede k další pozitivní vlastnosti v podobě znatelného nárůstu výkonu při těchto operacích. V G80 je pro texture filtering k dispozici jednotky pro zpracování až 64 pixelů za takt (pro srovnání GeForce 7800GTX umí „jen“ 24, má totiž 24 pixel pipeline), výkon 32 pixelů za takt pak v případě texture adressingu, stejně pro 2×AF a nakonec G80 umí 32 bilineárně filtrovaných pixelů za takt. Zrátka a dobře, v typických úlohách si GeForce 8800 GTX vede oproti předchozí generaci takto:
Všechny schopnosti „Lumenex engine“ na závěr doplňuje již dřívé známý 128bitový HDR rendering, který lze nyní provozovat současně s antialiasingem. DA převodníky GeForce 8800 jsou 10bitové (tedy schopny posílat do monitoru více než miliardu barev).