Diit.cz - Novinky a informace o hardware, software a internetu

Paměťová a cache architektura

Intel čtyřjádro
Po mnoha a mnoha měsících spekulací a nepotvrzených informací konečně sama společnost Intel poodhalila roušku tajemství kolem projektu Larrabee, od kterého si ona i IT svět jako takový, slibuje poměrně hodně. Co je tedy Larrabee zač, co od něho můžeme očekávat a jaké to za rok-dva po jeho uvedení na trh bude?

Navrhovat nízkolatenční vyrovnávací paměti Intel umí, o tom jsme se přesvědčili naposledy u Nehalemu. Jak to bude s Larrabee, jsme si již naznačili, nyní myšlenku dokončeme. Připomeňme, že každé Larrabee jádro nese 32/32 kB datové a instrukční L1 cache a také 256 kB L2 cache.

Každé jádro má přístup pouze do své 256kB části L2 cache, pokud by si potřebovalo popovídat (rozuměj: vyměnit data) s jiným jádrem, vše proběhne přes zmiňovanou prstencovou sběrnici, která sedí v hiearchii nad L2 (ve smyslu „dále od výpočetních jednotek“). Jádro, které potřebuje data od jiného, se jednoduše podívá do své L2 a pokud je tam nenajde, vyšle požadavek po prstencové sběrnici.

ATI RV770 nVidia GT200 Intel Larrabee
Scalar ops per L1 Cache 80 24 16
L1 Cache Size 16 kB ~ 32 kB
Scalar ops per L2 Cache 100 30 16
L2 Cache Size ~ ~ 256 kB

Intel se přitom narozdíl od konkurence s parametry svých vyrovnávacích pamětí v Larrabee nijak netají. Z hlediska skalárních operací je to pomalejší, ale dovolme si tiše předpokládat, že celková architektura GPU by z výrazně vyššího počtu tolik neprofitovala. Raději znovu připomeňme, že data v tabulce nelze přímo číselně porovnávat, je třeba je posuzovat v rámci komplexní architektury, která je ve všech třech případech velmi odlišná.

Je obecně známo, že předchozí generace GPU firmy AMD, ATI RV670, neslo 256 kB L2 cache, ale pro celé GPU. Dá se usuzovat, že RV770 nese L2 výrazně více, nicméně opět je to zlomek oproti Larrabee, kde svých 256 kB má každé výpočetní jádro, takže při 32 jádrech se dostáváme k celkové velikosti L2 cache 8 MB. Ohledně nVidie Anandtech předpokládá, že GT200 nese daleko více L2 cache než Larrabbe.

Ohledně L2 v Larrabee se vynořuje ještě jedna zajímavá myšlenka. Cache je plně spojitá stejně jako u CPU od tohoto výrobce a to má jednu potenciální výhodu (prozatím v hypotetické rovině). Takovéto uspořádání cache je velmi výhodné pro vzájemnou komunikaci více čipů. Když byl Intel dotázán, jak by takové dvě Larrabe mohla komunikovat spolu, tedy udržovat spojité obě oddělené L2 cache, byla by to prý pouze záležitost dostatečně rychlé komunikační linky mezi oběma čipy. Hypoteticky tedy ze hry vyřaďme PCI Express sběrnici, zatím si nedovolíme odhadovat, jestli by utáhla i hi-end verze dvou (více? ;-) Larrabee, ale skrývá se tu možný náznak nějakého vysokorychlostního komunikačního rozhraní ve stylu SLI/CrossFire můstků. Takže se nechme překvapit, ostatně to, že se chystá první Larrabee generace neznamená, že nepřijde druhá, třetí, …

David "David Ježek" Ježek

Bývalý zdejší redaktor (2005-2017), nyní diskusní rejpal.

více článků, blogů a informací o autorovi

Diskuse ke článku Architektura Intel Larrabee

Čtvrtek, 14 Srpen 2008 - 14:52 | Ren1 | ...
Čtvrtek, 14 Srpen 2008 - 14:39 | Anonym | Proc myslis, ze si myslim, ze me kazdy chce...
Čtvrtek, 14 Srpen 2008 - 13:59 | Ren1 | weepy> Ale no tak..:-( Myslis, ze bys...
Středa, 13 Srpen 2008 - 19:10 | Anonym | Ren: Prostredky, kterych pouzivas, se nelisi od...
Středa, 13 Srpen 2008 - 13:19 | Ren1 | weepy> Hehe, zase ta neurcita cestina...
Středa, 13 Srpen 2008 - 13:17 | Ren1 | weepy> Tak pocitam, ze uz bylo po debate,...
Středa, 13 Srpen 2008 - 11:06 | Anonym | Vsimas si, ze ses timto vlozil sam do diskuse,...
Středa, 13 Srpen 2008 - 09:51 | Ren1 | weepy> Urcite nic, co bys sam davno...
Úterý, 12 Srpen 2008 - 14:58 | Anonym | Ren: no tak flame uz je sociologicky prostudovany...
Úterý, 12 Srpen 2008 - 14:44 | Ren1 | weepy, Milan M> Panove, vasi debatu jsem...

Zobrazit diskusi