Jak zvládají 28nm grafiky GPGPU akceleraci?
I když se škála softwaru, který k rychlejšímu běhu dokáže využít potenciál grafického jádra, za poslední rok výrazně rozrostla, dá se říct, že množství testů zaměřených na GPGPU aplikace nestoupá - spíše naopak.
Vítáme proto zajímavý článek čínského serveru INPAI, který se podíval zhruba na jedenáct situací a porovnal výkon současné a minulé generace hardwaru od AMD i Nvidie.
Našim cílem nebude odprezentovat celý test asijské redakce, ani z něj vyvodit nějaké závěry ohledně celkového výkonu karet od AMD a Nvidie. Chceme jednak na tyto výsledky upozornit a hlavně ukázat, že teoretický výkon, architektura čipu, ani taktovací frekvence nemusejí vždy vypovídat o tom, co karta skutečně nabídne. Z jedenácti grafů jsme proto vybrali několik, které zkrátka neukazují nový hardware v tom nejlepším světle:
Velmi zajímavá čísla „vyplivnul“ Direct Compute & OpenCL Benchmark v0.45. Levý graf znázorňuje výkon pod OpenCL, pravý v Direct Compute. Prakticky jediné, co odpovídá očekávání, jsou výsledky GeForce v OpenCL (vlevo). Radeony HD 7000 v tomtéž nepochopitelně propadly, zatímco VLIW-5 Radeony starších generací vycházejí nereálně dobře. Naopak Radeon HD 6900 (architektura VLIW-4) vychází jako jediný podle očekávání.
Pod Direct Compute je situace opačná: Všechny Radeony vycházejí dobře, ale současná generace (HD 7000) podává až nereálně vysoké výsledky. V případě horších výsledků může být zdůvodněním chyba v ovladačích nebo bug či chybějící optimalizace v aplikaci, ale desetinásobný náskok Radeonů HD 7000 se vysvětluje dost obtížně - nepředpokládáme, že by jednoduchý test mohl tak výrazným způsobem profitovat z nové cache architektury GCN, a tak by nás nepřekvapilo, kdyby za nezvyklými čísly stál nějaký softwarový zádrhel.
Password Recovery test Accent Office ukazuje, jak to dopadá, když je aplikace připravena pouze na konkrétní hardware. Při použití novějších grafických karet vůbec nespustí hardwarovou akceleraci.
Výkon v double-precision nemá smysl příliš rozvádět, karty lze rozdělit do čtyř skupin: Podporují rychle, podporují středně rychle, podporují pomalu a nepodporují vůbec :-). Dodáváme jen tolik, že desktopové grafické karty Nvidia minulé generace mají výkon v double-precision uměle omezený. V grafu nám chybějí Radeony řady HD 5800, které oproti HD 6800 double-precision podporovaly poměrem 1/5 (Radeony HD 6900 a HD 7900 1/4, Radeony HD 7700 a 7800 1/16, GeForce GTX 600 1/24, GeForce GTX 580 1/8 a GeForce GTX 560 1/12).
Na závěr jsme vybrali jeden z grafů, který dává zhruba takové výsledky, jaké bychom s ohledem na teoretický výpočetní výkon a architekturu jednotlivých čipů mohli čekat. V tomto případě jde ale spíš o výjimku než pravidlo - na rozdíl od her, kde se výsledky obvykle nijak dramaticky nerůzní, je situace s GPGPU softwarem komplikovanější. Faktorů, které mají na celkový výkon vliv, je sice v obou případech celá řada, ale ve výpočetní sféře je zatím více slabých článků, které zatím nejsou vychytané - ať už na straně aplikace, v ovladačích nebo v hardwaru.
Pamětníkům to může připomenout dřevní doby hardwarové 3D akcelerace, kdy upgrade z původní 3Dfx Voodoo Graphics mohl v závislosti na konkrétní hře přinést různá překvapení - od zlepšení výkonu až po případy, kdy uživatel o akceleraci zcela přišel, protože kompatibilita hry začínala a končila podporou právě této jedné grafiky.
Kompletní výsledky najdete na: