Ring bus, výpočetní jádra
Kapitoly článků
Pamatujete na ní? V době Radeonu X1800 přišla AMD s poměrně flexibilní obousměrnou prstencovou paměťovou sběrnicí a kartám to velmi prospělo. Mezitím na ní zapracovali a v poslední generaci HD 4800 to dotáhli prakticky k dokonalosti s unikátním paměťovým hubem, se kterým 512MB grafice nedojde dech, ani když se má vypořádávat s více než 2 GB grafických dat a je současně stále dostatečně robustní pro takto výkonné grafiky (ale to už příliš odbočuji). Prstence se v zásadě vzdali v rámci uspoření prostoru na GPU, neboť propojit desítky prvků v GPU si vyžadovalo příliš mnoho signálových cest.
Larrabee tento aspekt ale nevadí, jeho interní prstencová sběrnice by měla mít celkovou šířku 1 024 bitů, 512 v obou směrech. Předpokládá se spárování čipu s rychlými GDDR5 pamětmi, které příští nebo přespříští rok budou již zcela banální levnou záležitostí. AnandTech předpokládá běh pamětí na shodné frekvenci s GPU, tedy někde za hranicí 2 GHz, což GDDR5 na Radeonu HD 4870 umí už dnes.
Prstencová sběrnice bude totiž v případě Larrabee výrazně výhodnější. Návrh dělené L2 cache a použití ring bus pro udržení spojitosti dat a usnadnění komunikace dílčích prvků architektury je v této situaci velmi výhodný a současně potřebný pro masivní přesuny dat mezi dílčími výpočetními jednotkami s jejich doprovodnou logikou. Řešení v podání Larrabee zajišťuje nízkou latenci a spojitost dat mezi L1 a L2 cache za současně vysoké rychlosti přenosu dat za úrovní L2. Opět by z toho měla těžit rychlost výpočtů (ať již půjde o jakákoli data).
Kolik výpočetních jader?
Prvotní propočty hovoří o 16 až 32 jádrech, ale odhad, kolik bude mít prvotní varianta uvedená na trh, je stále jen odhad, může to být klidně 24. Ale zkusme se vrátit k našemu experimentu z počátku článku a trochu počítat.
Prvotní experiment pracoval s desetijádrovým Larrabbe s rozměry čipu zhruba na úrovni Core 2 Duo. Ze specifikací to vypadá na 4MB L2 Core 2 Duo vyráběné 65nm procesem s velikostí čipu 143 mm². Vynásobme to dvěma a jsme zhruba na rozměrech ATI RV770 při 20 jádrech. Ještě jednou dvěma a jsme přibližně na úrovni GT200 při 40 jádrech.
A nyní si uvědomme, že Larrabee přijde až za rok-dva. Přejděme tedy na 45nm proces, který nám uspoří zhruba 30 až 40 % z plochy čipu. 40jádrové Larrabbe by pak mohlo mít velikost čipu zhruba 370 mm² a při hypotetickém čipu rozměrů nVidie by Intel mohl vyrobit i 64jádrové Larrabee (jen připomenu, že by mělo 1 1024 vektorových jednotek) pro hi-end segment a právě 24 a 32jádrovou verzi pro mainstream. Toto vše samozřejmě naráží na limity v napájení a schopnosti takové monstrum uchladit. Už GeForce GTX 280 je se svým požadavkem na 6+8pin PCIe napájení celkem na hranici a Larrabee, pokud můžeme soudit dle dřívějších spekulací, půjde ještě dále.