Intel uvádí Haswell alias procesory Core 4. generace
Kapitoly článků
Tempo vývoje grafické akcelerace je v přímém kontrastu k tempu vývoje procesorové části. Intel zkrátka využívá náskoku v procesorovém výkonu, který má před AMD a snaží se v posledních letech dohnat, co dlouhé roky zanedbával. Inovace grafické části ve srovnání s minulou generací (Ivy Bridge) bychom mohli shrnout do tří zásadních celků:
- kompatibilita s novými standardy (DirectX 11.1, OpenCL 1.2)
- grafický výkon (uzpůsobení pro více výpočetních bloků)
- video (změny pro zlepšení kvality i výkonu)
První celek není třeba sáhodlouze rozebírat, Ivy Bridge nabízela podporu DirectX 11 a OpenCL 1.1; Haswell povyšuje na DirectX 11.1 a OpenCL 1.2. Intel se tak (společně s AMD) řadí k výrobcům, kteří z nějakého důvodu považují podporu DirectX 11.1 za relevantní. Tím předbíhá Nvidii, která tento standard hardwarově nepodporuje a jeho důležitost (v závislosti na konkrétním období) různou měrou zpochybňuje. Přejděme k samotné architektuře:
Haswell - architektura 3D jádra
Nejvýraznější změnou prošel front-end (1) grafického jádra. Přinejmenším podle schématu poskytnutého Intelem působí, jako kdyby byl základní koncept navržen přesně podle konceptu teselace pro DirectX 11. Hlavním cílem však bylo dosažení takového výkonu, který bude stíhat zásobování daty 40 EU (execution units) nejvýkonnější verze grafiky, řady GT3.
Sytě fialové bloky (4, 5 aj.) znázorňují multimediální jednotky, kterým se budeme věnovat podrobněji v samostatné kapitole. Základní blok 3D jádra nazývá Intel jako „slice“. Podíváme se nejprve na tzv. sub-slice (3), tedy výpočetní část tvořenou bloky EU. Počet EU může být variabilní v závislosti na požadovaném aritmetickém výkonu každého slice a tedy i celého čipu. Nejčastěji se zřejmě bude setkávat s konfigurací s 6 EU na sub-slice (modely GT1) a 10 EU na sub-slice (modely GT2 a GT3). Každou EU pak tvoří čtveřice aritmeticko-logických jednotek (ALU).
Každý sub-slice nese vlastní texturovací jednotku; je však třeba podotknout, že hovoříme trochu jiným názvoslovím než v případě AMD a Nvidie. Tentokrát texturovací jednotkou míníme skupinu několika různých typů dílčích jednotek, které se podílejí na práci s texturami. Intel uvedl, že v některých operacích jsou „texturovací jednotky“ Haswellu 4× výkonnější než v případě Ivy Bridge, ale již neupřesnil, o které operace jde.
Nemůžeme tudíž posoudit, do jaké míry se toto zlepšení může projevit na celkovém výkonu. Z branže jsme však zvyklí, že pokud výrobce mluví o zlepšení, které dále nerozvádí, jde zpravidla o kosmetickou záležitost, která se na reálném výkonu odrazí maximálně v jednotkách procent. Předpokládáme proto, že za měřitelné rozdíly herního výkonu bude spíš než úprava texturovacích jednotek zodpovědné navýšení počtu celých grafických bloků (slice) a částečně rychlejší front-end.
Rozdělení zátěže a energetická stránka
Jednotlivé bloky slice mohou být řetězeny, například verze jádra GT3 nese celkem 2 (na schématu níže). Slice pak pracují při renderingu nezávisle, každý na vlastním kousku scény. Podporují nezávislé vypínání, což se pozitivně projeví ve spotřebě energie například v multimediálních úlohách, kdy je vytížen jen jeden (druhý zůstane deaktivovaný a nekonzumuje energii). Podobně umí jádro nakládat s jednotlivými EU - nevyužité vypíná.
Blok (2) znázorňuje vše, co se týká rasterizace a pixelových operací, jde tedy o ekvivalent rasterizéru a ROP jednotek. Tato část je rovněž v případě verze GT3 oproti schématu zdvojnásobena.