Architektura GPU, SIMD a Graphics Engine
Kapitoly článků
Evolučně vzniklé nové GPU nese architekturu označovanou nyní jako TeraScale2. Poskytuje dle AMD více než 2× vyšší výkon než generace předchozí - Radeon HD 4890 uměl 1,36 TFLOPS, Radeon HD 5870 zvládá 2,72 TFLOPS (nám to teda, nic proti, dává přesně dvojnásobek :-). Vylepšení zahrnula jak instrukční sadu (pochopitelně, Direct3D 11 a spol. si žádá něco navíc) a jednotky stream procesorů, ale také samotný návrh SIMD (Single Instruction, Multiple Data), grafický engine, texturovací jednotky, render back-ends a řadiče displeje.
Schéma architektury GPU je velmi podobné předchozím generacím 4800, 3800 a částečně i 2900 (a dokonce i X1000). Vedle výpočetních jader, texturovacích jednotek a příslušných cache zmiňme známý ultra threaded dispatch procesor, který si svoji premiéru odbyl v HD 2900 a stará se o „rozhazování“ výpočtů mezi jednotlivé výpočetní bloky dle jejich vytížení. V grafickém engine se sluší zmínit renesanci zažívající tesselátor a s ohledem na DirectX 10.1 i Geometry Assembler obstarávající záležitosti kolem geometry shaderů (podobnou úlohu sehrává i Vertex Assembler).
Zvenku GPU přistupuje pochopitelně k PCI Express sběrnici, dále k pamětem přes shodnou architekturu řadiče jako HD 4800, dále je zde CrossFire X rozhraní pro propojení více grafik (přes něj si ty nejrychlejší modely předávají data, lowendové karty to možná ještě budou umět po PCI Express sběrnici) a také UVD hardwarový decoding videa. Jak píšeme, jde o evoluci ve stylu „Strany mírného pokroku v mezích zákona“, nikoli revoluci.
SIMD engine
Zmínili jsme výpočetní jádra, což je takový veselý termín pro SIMD engine. Těch je v GPU dvacet a představují ucelené bloky. Každý ze SIMD engine obsahuje 16 thread procesorů každý o 5 vláknech (celkem tedy 160 stream procesorů), 80 texturovacích jednotek je pak rozděleno po čtyřech v každém SIMD engine. Celek pak využívá paměťový subsystém s GDDR5 a celkovou propustností přes 150 GB/s.
Malé srovnání dílčích částí GPU, vedle parametrů věnujte zejména pozornost spotřebě HD 5870 v klidu. Ta je dle měření AMD vskutku vynikající, vypadá to, že vedle úspor v rámci GPU se podařilo popasovat i s lowpower režimy GDDR5 čipů, s nimiž na Radeonech AMD zpočátku zápasila. Základem jsou pochopitelně ještě nižší klidové frekvence GPU a GDDR5, nové VRM rozhraní, hardwarová detekce teploty napěťových regulátorů k prevenci přehřívání a Ultra Low Power State pro multi-GPU konfigurace.
Graphics Engine
Grafický engine obsahuje nový tesselátor 6. generace programovatelný skrze DirectX 11 hull a domain shadery s novými algoritmy redukujícími riziko nežádoucích artefaktů. Novinkou z DirectX 11 je Pull Model interpolace, která využívá stream procesory k interpolaci s novými instrukcemi. Zlepšila se využitelnost a poklesla spotřeba výkonu při použití této interpolace. Dále zvyšuje výkon aktualizací Constant Bufferu, rychlejší je i Geometry Shading. Pokud odhlédneme od DirectX, pak OpenGL dostává s tímto GPU do vínku rychlejší Line Rendering a Clipping a 12bitovou přesnost subpixelů.