Monolitický 16-jádrový Steamroller s podporou PCIe3 bude
Právě odborná dokumentace k procesorové architektuře Steamroller (zveřejněná v souvislosti s vydáním Kaveri) už přinesla potvrzení spekulace, že nové APU obsahuje čtyři kanály paměťového řadiče, z nichž jsou využívány pouze dva. Tím zajímavosti nekončí, tentokrát vyšlo najevo, že dvoumodulová - čtyřjádrová varianta procesoru, kterou obsahuje Kaveri, není konečná. Přes všechny zvěsti o konci velkých monolitických procesorů od AMD totiž existuje dokumentace k jednočipové šestnáctijádrové variantě:
Přestože oficiální schéma mluví samo za sebe, jeden bod si zaslouží vysvětlení. Zatímco v souvislosti s architekturou APU Kaveri zavedla termín „compute core“ (CC), který velmi přesně nadefinovala a který označuje jak procesorové, tak grafické jádro (GCN compute unit), pak v tomto případě v souvislosti se samostatným Steamrollerem hovoří o „compute unit“ (CU), což odpovídá jednomu procesorovému modulu, tedy dvěma jádrům. Osm CU je tedy šestnáct jader:
Asi nebude velkým překvapením, že se cílem těchto čipů stanou 2P a multiprocesorové servery. Zajímavějším tématem k zamyšlení je výrobní proces, na kterém by podobný procesor bylo možné realizovat. Server X-bit labs hovoří minimálně o 20nm nebo 14nm procesu. I když lze tuto možnost připustit, principielně nic nebrání tomu, aby popsaný čip AMD vyráběla na stávajícím 28nm procesu.
Vzhledem k tomu, že máme k dispozici mikrosnímek jádra Kaveri, víme, že čtyři procesorová jádra Steamroller (včetně L2 cache) zabírají jen o chlup přes čtvrtinu plochy 245mm² APU. Šestnáct jader včetně L2 cache by (přesněji propočteno) dosahovalo 260 mm². Samozřejmě musíme přidat paměťové rozhraní, integrovaný north-bridge, nějaké PCIe linky… čímž se dostáváme na zhruba 300 mm². Tedy stále nic, co by nebylo možné realizovat už stávajícím výrobním procesem a co by nebyl problém vměstnat do ~125W TDP.
Otázkou zůstává, zda a kolik by tento čip obsahoval L3 cache. To je poměrně klíčová otázka, protože právě L3 cache je to, co významně zvyšuje plochu jádra. Pro hrubou představu lze předpokládat, že by každé 2 MB L3 cache přidaly 7-10 mm². Při 16MB L3 se pak dostáváme na plochu kolem 360 mm², při 32MB bychom hovořili o 430 mm², což už je poněkud přes čáru. Je ale možné, že by plocha potřebná pro L3 cache byla menší, než předpokládáme. Starší roadmapy AMD například počítaly s 32nm monolitickými desetijádry pro desktop i servery a pokud by bylo možné realizovat něco takového, nebyl by důvod k nerealizovatelnosti šestnáctijádra na 28nm procesu.
Nasazení 20 či 14nm výroby má spíš jinou příčinu. Už před časem AMD ohlásila, že při vývoji nových procesorů bude primárně cílit na segment APU, pro který novou architekturu připraví nejdříve. Následně bude pokračovat na jejím vylepšení (např. rozšíření o novější instrukční set) a tuto druhou verzi vydá později a postaví na ní samostatné procesory. Je tudíž možné, že v době, kdy bude tato druhá generace Steamrolleru hotová, již budou k dispozici lepší výrobní procesy než současný 28nm a nebude tudíž důvod u současného setrvat.
Ať už po stránce výrobního procesu situace dopadne jakkoli, zůstává faktem, že AMD s vývojem velkých samostatných procesorů neskončila (alespoň ne prozatím).