Diit.cz - Novinky a informace o hardware, software a internetu

Nové Radeony přichází na trh

Staré ATI logo
Po dlouhých a dlouhých peripetiích k nám konečně doputovaly karty z nové generace Radeon X1?00. ATI tak konečně dává svým fanouškům modely se Shader Modelem 3.0, přidává i FSAA (včetně adaptivního) při HDR režimu a přináší třeba i firemní technologii AVIVO. Pokud vás zajímá, co za technologie si kanadský výrobce pro nás připravil a jaké jsou tedy parametry a vzhled uvedených karet, čtěte dále.

Kapitoly článků

1.  Architektura
2.  Parametry

GPU ATI R520Ze všeho nejdříve se podívejme na architekturu čipů, protože se jedná o tu nejdůležitější a současně nejzajímavější část celku. No a pro ukázku nám neposlouží nic menšího než vlajková loď v podání čipu R520, nesoucí „pouhých“ 320 miliónů tranzistorů na ploše 288 mm² a vyráběná 90nm výrobním procesem v továrnách TSMC.



R520 architektura

Pixel shader

Pixel shadery, jak vidíte na diagramu, jsou rozděleny do čtyř bloků po čtyřech a o jejich krmení daty se stará nedávno zmiňovaný „Ultra Threaded Dispatch Processor“. Na ten se podívejme trochu podrobněji.

R520 Pixel Shader Architektura

Jeho primárním cílem je to, aby dlouhé pixel shaderové výpočty „rozsekával“ na menší a ty pak symetricky rozděloval mezi jednotlivé pixel shadery v závislosti na jejich vytížení. Mělo by tak v podstatně menším množství případů docházet k situacím, kdy se jeden shader „morduje“ s brutálním výpočtem, zatímco jeho soused se „fláká“.

Ale díky tomuto rozdělení je pak při shader výpočtech zapotřebí spousta dočasných mezihodnot, které pak slouží jako vstupní data pro další krok výpočtů v shaderech. Za účelem přechovávání těchto hodnot je v čipu k dispozici řada univerzálních registrů, které zvládají současně mnohonásobné čtení i zápis a mají vysokorychlostní spojení s každou ze shaderových ALU (aritmeticko-logických jednotek).

Dalším přínosem „štěpení“ výpočtů v shaderech je možnost využití dynamického větvení výpočtů. Shadery pak nemusí počítat univerzálně úplně vše co je jim podsunuto, ale vývojáři mohou implementovat metody, které zajistí počítání jen toho, co je potřeba (viz obrázek).

R520 optimalizace

Vertex Shadery

R520 Vertex Shader Architektura

R520 prozatím ještě (narozdíl od R500 Xenos v konzoli Xbox 360) nemá jednotné shadery a tudíž se stále ještě budeme bavit nejen o pixel, ale i vertex shaderech. Vertex shaderů nese R520 celkem osm (tedy stejně jako GeForce 7800 GTX). Nedoznaly od dob R4xx či R3xx příliš velkých změn, R520 používá 128bitovou vektorovou a 32bitovou skalární jednotku, vždy se tedy počítá s 32bitovou přesností v plovoucí desetinné čárce.

Obecně pak byly vlastnosti shaderů vylepšeny tak, aby splňovaly Shader model 3.0, což zahrnuje výpočty o délce až 1024 instrukcí, větvení, smyčky a podprogramy a větší temp registr.

Architektura paměťového systému

S nárůstem paměťových potřeb v grafických kartách dospěla ATI k závěru, že konvenční přístup k paměťovému systému potřebuje „revoluci“. Paměť potřebovala v grafickém čipu stále více místa a tranzistorů a zvyšovaly se tak i náklady na výrobu. Navíc díky tomu hrozila čím dál tím větší šance na lokální tepelné přetěžování čipů díky komunikaci, probíhající mezi paměťovými čipy a jejich řadičem v GPU v souvislosti s nevhodnou architekturou (a tím umístěním k tomu potřebných tranzistorů v čipu). Z toho důvodu ATI do R520 zvolila „prstencovou“ sběrnici.

R520 architektura prstencové sběrnice

Diagram ukazuje, že paměťový subsystém v GPU se skládá z hlavního paměťového řadiče (říkejme mu třeba „Velký Fru-Fru“) a několika „klientskými rozhraními“, které právě obstarávají datové požadavky mezi řadičem a pamětí. Celý tento systém je „obehnán“ obousměrnou 256bitovou sběrnicí (která tak dává právě oněch 512bitů), běžící na stejné frekvenci jako paměti. Díky obousměrnosti se tak data v rámci prstence dostanou na druhou stranu („ven“ nebo do centrálního řadiče) maximálně za polovinu trasy prstence - a to je ten nejhorší scénář. zároveň díky rozložení této prstencové sběrnice není v jednom místě u centrálního řadiče příliš velká hustota tranzistorů, čímž je vcelku slušně ošetřeno zmiňované lokální tepelné přetěžování celého GPU.

Samotný centrální řadič je pak plně programovatelný. ATI u paměťového systému udává čtyřikrát vyšší efektivitu v náhodném přístupu do paměti, než měly předchozí generace čipů.

RV530 je pak ve srovnání s R520 samozřejmě podstatně „chudší“ a menší čip, jeho prstencová sběrnice má šířku poloviční, tedy 256 bitů (2×128). RV515 žádnou specialitku v podobě prstencového řadiče neobsahuje, spoléhá se na konvenční design.

Paměťový řadič v R520 si dokáže poradit se všemi typy pamětí, výhledově i s GDDR4, kterých bychom se mohli dočkat v průběhu příštího roku a to na frekvencích sahajících za 1 800 MHz.

R520 také nese plně asociativní cache, zatímco R4xx měla napevno svázány části cache s oblastmi v paměti. Různé části cache tak mohou být libovolně propojeny s různými částmi externí paměti (míněna externost ve vztahu ke GPU). Takto nyní fungují všechny vyrovnávací paměti (Texture, Colour, Z, Stencil). Optimalizací prošel i Z Buffer, jež má být nyní efektivnější o 60 %.

Ještě malé vizuální srovnání toho, jaký je rozdíl mezi architekturami čipů R520, RV530 a RV515:

Srovnání architektur R520, RV530, RV515

Renderování

Nové čipy zvládají HDR metodu renderování a to včetně současně počítaného fullscreen antialliasingu (viz obrázky z Far Cry).

R520 Far Cry bez HDR R520 Far Cry s HDR

Tak tolik k teorii, nyní se tedy definitivně podívejme na přichystané modely.

Kapitoly článků
1.  Architektura
2.  Parametry

David "David Ježek" Ježek

Bývalý zdejší redaktor (2005-2017), nyní diskusní rejpal.

více článků, blogů a informací o autorovi

Diskuse ke článku Nové Radeony přichází na trh

Středa, 7 Prosinec 2005 - 15:41 | goro | Všichni jste blázni!!! Jenom já jsem letadlo ......
Pátek, 7 Říjen 2005 - 09:36 | Anonym | To Rodney: No jsem rád, že jsme se konečně shodli...
Čtvrtek, 6 Říjen 2005 - 23:39 | xrodney | Macros: Navic sem vystudoval obor se zamerenim na...
Čtvrtek, 6 Říjen 2005 - 23:17 | xrodney | Macros: Kazdopadne se nad sebou trosku zamysli...
Čtvrtek, 6 Říjen 2005 - 23:07 | xrodney | Macros: xjo ses trosku mimo, porad rikas &...
Čtvrtek, 6 Říjen 2005 - 17:55 | Anonym | To Rodney: Ještě jenom pro tvoji informovanost:...
Čtvrtek, 6 Říjen 2005 - 17:35 | Anonym | To Rodney: konečně mě někdo dobře rozesmál :-)....
Čtvrtek, 6 Říjen 2005 - 16:56 | xrodney | Macros: xjo, di uz s tim F.E.A.R. nekam. 1) demo...
Čtvrtek, 6 Říjen 2005 - 16:28 | Anonym | U ati je to krok zpet, vzpominam si tak na gf5800...
Čtvrtek, 6 Říjen 2005 - 16:07 | Anonym | To Neomen: no jasne,aj to je zaujimavy uhol...

Zobrazit diskusi