Rozbor: AMD vydává Kabini a Temash, low-power x86 čtyřjádra
Kapitoly článků
O procesorovém jádru Jaguar jako takovém i grafické architektuře GCN jsme si nejednou psali a bylo by tudíž zbytečné opakovat, čím se vyznačují nebo liší od svých předchůdců - to vše najdete v našich rozborech:
- AMD představila architekturu procesorů Jaguar: Vyšší IPC, AVX, nová L2 cache… (2012)
- Nečekaně odborná prezentace odhaluje procesor AMD Jaguar (2013)
- Dieshot 28nm APU aneb co ukrývá jádro Kabini?
Zaměříme se tedy na to, co zatím nebylo známé nebo potvrzené. APU Temash a Kabini se neliší hrubými parametry - oba čipy nesou až čtyři procesorová jádra, (až) 128 stream-procesorů architektury GCN a integrovaný čipset (jde o SoC). Liší se cílovým segmentem a tedy i TDP.
Grafické jádro
Začněme však tím, co mají společné. Grafické jádro sestává ze dvou bloků CU (compute unit) architektury GCN. AMD však nevzala pouze hotové kostičky a neposkládala z nich nový čip, ale provedla několik kosmetických úprav, jejichž účelem je snížení počtu tranzistorů a tím i nějaká úspora energie. Asi nejrazantnější změnou v tomto směru je geometrická část, která je oproti desktopovým čipům omezena na 1/4 polygonu za takt. Tato úprava zcela odpovídá poměru geometrického a aritmetického výkonu, jak jej známe z desktopu. Fakticky jde o 1/8 výkonu Radeonu HD 7850 (z obou jmenovaných hledisek).
Zachována zůstala podpora pro double-precision výpočty, která je oproti single-precision podporována v poměru 1/16. Některé specifické operace v DP zvládá rychleji, jiné pomaleji. Ve všech čipech, které zatím AMD ohlásila, je aktivních všech 128 stream-procesorů (liší se jen frekvencemi). Čistě teoreticky by sice bylo možné jeden blok CU zamknout a vytvořit čip s 64 SP, ale to v případě relativně malého APU nemá valný smysl (cache pro oba bloky CU je sdílená, takže tu částečně deaktivovat nelze, tzn. případný výrobní defekt v rámci této části cache se deaktivací jednoho CU zachránit nedá). Lze však připustit, že po čase (~rok?) od vydání se může nashromáždit dostatečný počet čipů s jedním (přesně) defektním CU, aby se vyplatilo vydání modelu o 64 stream-procesorech.
Kabini, která je určená pro levnější notebooky, ultrathin platformu a podobná řešení, nabízí grafické jádro taktované v rozmezí 300 až 600 MHz (300 - 450 MHz pro nižší řadu E, 500 - 600 MHz pro vyšší řadu A). Tabletový Temash disponuje grafikou taktovanou mezi 225 a 400 MHz dle modelu.
Procesorová část
Konfigurace procesorových jader je poněkud pestřejší, liší se nejen frekvencí, ale také počtem aktivních modulů. Jaguar oproti Bobcatu přešel na modulární architekturu, kde jeden modul = dvě jádra + sdílená L2 cache. Tato konfigurace je výhodnější, protože jednovláknovým úlohám zpřístupňuje dvojnásobnou kapacitu cache (u Bobcatu nemohlo jedno jádro využít cache druhého).
Patrně největší změnou je nová load/store unit, která byla (po procesorové stránce) největší brzdou Bobcatu. Jejím přepracováním dosáhla AMD zhruba 15% navýšení IPC (často uváděných 20%+ počítá ještě s přínosem nové architektury cache).
Specifickou záležitostí je již známá jednotka pro dělení převzatá z APU Llano (K10.5), která dosahuje teoreticky 2× lepších výsledků než řešení použité v Bobcatu (dva bity v cyklu oproti jednomu). Výkon běžných úloh samozřejmě bude ovlivněn jen menší měrou, nelze předpokládat, že by tato změna přinesla výrazné výkonnostní rozdíly.
AMD, Anandtech