Paměťová a cache architektura
Kapitoly článků
Navrhovat nízkolatenční vyrovnávací paměti Intel umí, o tom jsme se přesvědčili naposledy u Nehalemu. Jak to bude s Larrabee, jsme si již naznačili, nyní myšlenku dokončeme. Připomeňme, že každé Larrabee jádro nese 32/32 kB datové a instrukční L1 cache a také 256 kB L2 cache.
Každé jádro má přístup pouze do své 256kB části L2 cache, pokud by si potřebovalo popovídat (rozuměj: vyměnit data) s jiným jádrem, vše proběhne přes zmiňovanou prstencovou sběrnici, která sedí v hiearchii nad L2 (ve smyslu „dále od výpočetních jednotek“). Jádro, které potřebuje data od jiného, se jednoduše podívá do své L2 a pokud je tam nenajde, vyšle požadavek po prstencové sběrnici.
|
Intel se přitom narozdíl od konkurence s parametry svých vyrovnávacích pamětí v Larrabee nijak netají. Z hlediska skalárních operací je to pomalejší, ale dovolme si tiše předpokládat, že celková architektura GPU by z výrazně vyššího počtu tolik neprofitovala. Raději znovu připomeňme, že data v tabulce nelze přímo číselně porovnávat, je třeba je posuzovat v rámci komplexní architektury, která je ve všech třech případech velmi odlišná.
Je obecně známo, že předchozí generace GPU firmy AMD, ATI RV670, neslo 256 kB L2 cache, ale pro celé GPU. Dá se usuzovat, že RV770 nese L2 výrazně více, nicméně opět je to zlomek oproti Larrabee, kde svých 256 kB má každé výpočetní jádro, takže při 32 jádrech se dostáváme k celkové velikosti L2 cache 8 MB. Ohledně nVidie Anandtech předpokládá, že GT200 nese daleko více L2 cache než Larrabbe.
Ohledně L2 v Larrabee se vynořuje ještě jedna zajímavá myšlenka. Cache je plně spojitá stejně jako u CPU od tohoto výrobce a to má jednu potenciální výhodu (prozatím v hypotetické rovině). Takovéto uspořádání cache je velmi výhodné pro vzájemnou komunikaci více čipů. Když byl Intel dotázán, jak by takové dvě Larrabe mohla komunikovat spolu, tedy udržovat spojité obě oddělené L2 cache, byla by to prý pouze záležitost dostatečně rychlé komunikační linky mezi oběma čipy. Hypoteticky tedy ze hry vyřaďme PCI Express sběrnici, zatím si nedovolíme odhadovat, jestli by utáhla i hi-end verze dvou (více? ;-) Larrabee, ale skrývá se tu možný náznak nějakého vysokorychlostního komunikačního rozhraní ve stylu SLI/CrossFire můstků. Takže se nechme překvapit, ostatně to, že se chystá první Larrabee generace neznamená, že nepřijde druhá, třetí, …