x86 se otřásá v základech: Nvidia skutečně zaintegruje ARM do svých GPU
Budoucí produkty rodiny Tesla (připomeňme, že superpočítač Titan v Oak Ridge dostal před pár dny do vínku téměř 19 tisíc karet Tesla K20 „velký Kepler“) budou kombinovat svůj GPGPU výkon s 64bitovou ARM architekturou. Tam, kde AMD přijde s ARMovými Opterony, tam Nvidia přinese Tesly s ARMem uvnitř. Zajímavé v kontextu toho, že Titan nese CPU Opteron a GPU Tesla, že? Každopádně Projekt Denver společnosti Nvidia tímto nabírá konkrétnější podoby.
CTO Nvidie, Steve Scott, prohlásil, že „Tegra bude zvládat výpočty na GPU v nepříliš vzdálené budoucnosti. Někdy v tomto desetiletí také začneme uvádět pohromadě integrovaná CPU a GPU v rámci řady Tesla“. Scott se přitom odkazoval na architekturu ARMv8 a čerstvě ohlášená CPU jádra Cortex-A53 a Cortex-A57, což vše souvisí s uvedením v roce 2014 (stejný rok, o jakém hovoří i AMD). ARMv8 má přitom licencována již celá řada firem, vedle Nvidie a AMD jsou to Broadcom, Calxeda, HiSilicon, Samsung či STMicroelectronics.
Já nyní budu vařit trochu z vody: superpočítač Titan nyní dostal do vínku téměř 19 tisíc 16jádrových Opteronů a téměř 19 tisíc karet Tesla K20. Opterony zde přitom budou sloužit hlavně jako přípravna dat a výpočtů pro karty Tesla, neboť výkon 2492jádrových 732MHz Tesel je prostě oproti 16jádrovým 2,2GHz Opteronům famózní. Předpokládejme tedy, že u Maxwellu bude Nvidia schopna umístit na procesorovou die tolik ARMových jader a tak rychle taktovaných, že budou postačovat jako přípravna dat pro samotnou GPU část. V tu chvíli by se Opterony staly, když už ne úplně, tak alespoň částečně, nepotřebnými.
Je třeba mít totiž na paměti jednu věc: když byl nyní superpočítač Jaguar upgradován a stal se z něj Titan, stoupla jeho spotřeba ze 7 na 9 MW. V Oak Ridge nemůžou jít do nekonečna, či lépe řečeno: u superpočítačů je potřeba zajistit, aby si i příští generace vystačily se stejnou spotřebou. O tom celém jsou výzkumné projekty realizované v rámci tzv. ExaScale Study, kdy se přední firmy v oboru (od Nvidie, přes IBM až po Cray) snaží najít cesty, jak se dostat ze současných PFLOPs (Peta Flops) na EFLOPs (Exa FLOPs) bez nárůstu spotřeby. A zde mohou právě ARMová CPU jádra přispět, protože ač nejsou nejrychlejší, je obecně efektivita této architektury co do poměru výkon/spotřeba lepší než u x86. Intel vyrábí procesory Ivy Bridge/Haswell 22nm procesem, asi tím nejlepším, co aktuálně na světě funguje. ARMy se nyní typicky vyrábějí v rozmezí 28 až 45 nanometrů. Kdyby měli ARMoví výrobci přístup k továrnám Intelu, byl by na tom rozdíl mezi x86 a ARMem ještě lépe (nebo hůře, záleží, z které strany barikády se na problém díváte).
Ať již tedy nástupce Titanu bude mít karty Tesla s vlastními ARM jádry, nebo k nim nadále bude přidávat nějaké ty Opterony, bude pro budoucnost oboru klíčové toto: budou ty Opterony mít jádra x86, nebo jádra ARM?
Více k tématu:
volně na motivy Toms Hardware