Texture Units, Render Back-Ends, CFAA
Kapitoly článků
Texture Unit
Texturovací jednotky mají předělán design na „proudnicový“, poměr výkon/mm² se tak dle AMD zvýšil o celých 70 %. Propustnost texturovací cache je pak dvojnásobná oproti RV670, jednotky zvládají až 160 fetches za hodinový takt.
Vylepšen je i design vyrovnávacích pamětí. L2 je přímo svázána s paměťovými kanály, L1 uchovává unikátní data jednotlivých SIMD jader (jak jsme psali výše, každé SIMD má svoji vlastní L1 texture cache). Celkově je tak navýšen výkon 5×, u L1 pak 2×. Vertex cache byla oddělena, nyní je samostatná. Propustnost L1 texture fetch vzrostla na 480 GB/s, přenosy mezi L1 a L2 pak lítají rychlostí 384 GB/s. Vše pak vyúsťuje v následující zajímavá čísla:
Render Back-Ends
Hlavní úsilí se zaměřilo na zvýšení poměru výkon/mm² při zapnutém antialiasingu. Špičkový výkon depth/stencil operací se zdvojnásobil na 64/takt, AA fillrate pro 32/64bitové barvy taktéž, stejně jako 64bit 0×AA pro 64bit barvy. Podporovány jsou samozřejmě jak fixní (MSAA), tak programovatelné (CFAA) režimy antialiasingu, podrobněji v článku o Radeonu HD 2900.
Nárůst oproti předchozí generaci v AA operacích je ve výsledku teoreticky dvojnásobný.
Praktická měření přímo od AMD potvrzují celkový nárůst výkonu při zapnutém 4×AA (v třetí části recenze se na toto sami blíže podíváme).
Edge Detect CFAA filtry nabízejí režimy 12× a 24× při stejné spotřebě paměti jako 4×, resp. 8× MSAA, pracují bez problémů s adaptivním antialiasingem a jejich účelem je samozřejmě omezit (resp. rovnou se vyhnout) rozmazání hran využitím dodatečných vzorků podél hran, nikoli křížem přes ně.
Takto vypadá výsledek v Half-Life 2.
A takto srovnání výkonu při použití CFAA ve třech známých hrách.