Použité technologie
Kapitoly článků
nVidia CineFX 4.0 Engine
CineFX technologie ve své čtvrté reinkarnaci doznala několika změn. Pipeline jednotky byly kompletně předělány za účelem snížení latence a vyšší výpočetní síly připadající na jeden takt. „Překopán“ byl jak design Vertex Shaderů, které nyní provádějí zadané operace rychleji než dříve, tak i Pixel pipelines a nový texturovací engine. nVidia jako příklad uvádí „multiply-add“ (MADD) operace, které dle ní na této nové kartě probíhají až dvakrát rychleji, než na GeForce 6800 Ultra (zatímco třeba triangle setup zaznamenává nárůst okolo 30 %). No uvidíme v testech v další části, jak se toto projevuje v reálném výkonu současných her.
MADD operace jsou vcelku zajímavé tak se u nich na chvíli zastavme. „Multiply and accumulate“ jsou jedny z nejčastěji používaných matematických operací v 3D grafice, provádějící transformace, nasvětlení, výpočty normálových map a mnohé další operace. Ukázka reliéfu na konvičce pod tímto textem prezentuje typický detailní objekt, který těží z vyššího výpočetního výkonu karty v této oblasti. Reliefové mapy jsou zde použity k vytvoření vyvýšenin a zvýraznění tvaru dřevěné „podložky“.
Samozřejmě je toho daleko více, co karta umí, přičemž mnoho z uváděných technik je v grafických kartách již dlouhou dobu. V oblasti Vertex Shaderů, které mají MIMD (Multiple Instruction Multiple Data) architekturu třeba Displacement mapping, Geometry instancing, neomezeně dlouhé vertexové programy, Vertex texture fetch (s možností Mip-mappingu). Pixel Shadery disponují Full pixel branching, Four Multiple Render Targets (MRTs), nekonečně dlouhými pixel programy. Texture Engine si poradí s 24 texturami během jednoho renderovacího průchodu, podporuje 16 a 32bitový formát, 16násobné anisotropní filtrování, sRGB formát textur či DirectX a S3TC kompresi. Architekturu Pixel Shaderů naleznete na následujícím obrázku.
HDR rendering
nVidia High Dynamic-Range (HDR) renderování je naše stará známá z GeForce 6800 generace, která samozřejmě nechybí ani v generaci nejnovější. Používá 16/32bitovou práci v plovoucí řádové čárce na jednu barvu (64/128bitovou v RGBA celkově), což zvyšuje celkový kontrast renderované scény (oproti standardnímu 8/32bitovému renderování, které však karta také plně ovládá). Vývojáři přitom nebudou mít nijak těžkou práci s převodem aplikací pro tento systém, současně však nejsou nuceni HDR využívat, nicméně lze očekávat, že tato technika zaznamená vzrůstající oblibu mezi tvůrci her (koneckonců v dnešní době je to z velké části vizuální stránka, která hry prodává). Přínos HDR můžete vidět na obrázcích ze her Far Cry a Splinter Cell Chaos Theory v další části článku.
nVidia si samozřejmě neodpustila srovnání výkonu svého nejnovějšího hřebce ve stáji oproti procesoru Intel Pentium 4 na frekvenci 3 GHz. Nakolik je toto srovnání přínosné či zcela zcestné si posuďte sami. Dle nVidie dokáže Pentium 4 na dané frekvenci ze sebe teoreticky „vyždímat“ v operacích v plovoucí řádové čárce výkon 12 GFLOP/s, zatímco GeForce 7800GTX v klidu kontroluje se svými 165 GFLOP/s.
nVidia UltraShadow II Technology
UltraShadow II je další technologií z předchozí generace, která taktéž nesmí v GeForce 7800GTX chybět. Díky ní dochází k úspoře části výkonu při renderování neosvětlených částí scény, jak demonstrují následující obrázky právě ze hry Doom 3 (vlevo vidíte, co se počítá standardně a vpravo to, co při zapojení ultraShadow II technologie).
nVidia Intellisample 4.0 Technology
Ta umí pár zajímavých věcí jako Gamma Adjusted Rotated-grid antialiasing, bezeztrátovou kompresi pro barvy, textury a Z-data, dále antialiasovací módy módy Transparency Adaptive Supersampling (pro vysokou kvalitu) a Transparency Adaptive Multisampling (pro vysoký výkon), 64bitové filtrování a míchání textur založené na technologii OpenEXR od Industrial Light & Magic (to vše v plovoucí řádové čárce) či kompresi normálových map.
Nové Antialiasing režimy
Přibližme si nyní více zmiňované nové metody antialiasingu.
Transparency Adaptive Supersampling
Metoda přidává do výpočtu další texel samply a antialiasovací průchody pro tenké objekty jako větve stromů, vegetace, pletivo apod. Tyto objekty jsou obecně renderovány velmi jednoduchými polygony (někdy dokonce i jen jedním polygonem) a složitost finálního obrazu (skupiny rostlin například) je dána texturou na tomto polygonu. Konvenční metody antialiasingu tady neslaví příliš velký úspěch, neboť hrany rostliny nebo větve jsou ve skutečnosti uvnitř nanesené textury a navíc tyto metody neprovádí vyhlazování pixelů u průhledných textur, jak to umí právě Transparency Adaptive Supersampling. Pixely uvnitř polygonu tak nejsou při konvenčním antialiasingu nijak ovlivněny. Transparency Adaptive Supersampling naproti tomu řeší tento nedostatek „vypnutím“ informací z alpha kanálu dané textury. Oblasti, které mají tuto informaci nastavenu jsou pak také antialiasovány přestože nejsou na okraji daného antialisovaného trojúhelníku (jakožto elementárního objektu). Výsledkem je pak daleko hladší obraz, jež demosntrují následující obrázky.
Na začátku je jednoduchý polygon s nanesenou jednobarevnou texturou:
Zde vidíte, již otexturované objekty, jež jsou viditelně zubaté a vroubkované. Běžné antialiasovací metody zde tedy nepřináší žádný výrazný pokrok:
Na tomto obrázku je již aplikován Transparency Adaptive Supersampling, jehož přínos je vidět zejména na nejtenčích lístečcích:
Transparency Adaptive Multisampling
Tato metoda také zvyšuje kvalitu antialiasingu s daleko vyšší úrovní výkonu, neboť se zde využívá jediný texel sample k výpočtu hodnot okolních subpixelů. Nicméně tato metoda neposkytuje tak špičkovou kvalitu antialiasingu jako Transparency Adaptive Supersampling, nýbrž vhodný kompromis mezi kvalitou výsledné renderované scény a celkovou rychlostí (jak antialiasingu, tak i tím pádem renderingu celé scény). Na následujícím obrázku vidíte přínos této metody oproti konvenčním antialiasovacím postupům. Zvláště dobře je to vidět na detailech větví a listech květin ve zvětšenině.
Tolik k novým antialiasovacím metodám
nVidia PureVideo Technology
Technologie PureVideo se samozřejmě nese v duchu moderní doby a nikoho asi dnes nepřekvapí plná podpora akcelerace DVD a WMV-HD až do rozlišení 1920×1080i. Samotný Video Processor je plně adaptabilní a tak nebude problém jej programovat pro nové video kodeky, dále zvládá hardwarově Video Color Correction. Všechny tyto funkce však neběží jen tak samy od sebe, software ve kterém pouštíte videa musí být schopen toho využít (nicméně osobně bych si tipoval že pro Windows Media Player či PowerDVD to příliš velký problém nebude a najdou se jistě i další). Čip také nemá problém ani s různými metodami odstranění prokládání (deinterlace) či všelijakou filtrací video signálu (a to i v nejvyšším video rozlišení 1920×1080i).