Výpočetní Ampere bude o 70-75 % rychlejší než Volta, dorazí v létě
Univerzita do konce roku provozovala superpočítač Big Red 2 z roku 2013, který byl vybaven akcelerátory Tesla K20 z generace Kepler. Kepler jakožto výpočetní řešení nebyl příliš šťastnou volbou, šlo o graficky zaměřenou architekturu, která nenabízela ani vysoký výpočetní výkon, ani technologickou výbavu. Grafické čipy té doby samozřejmě nebyly vybaveny žádnými specializovanými prvky pro AI, chyběla i podpora pro FP16, ale architektura Kepleru byla i na svoji dobu poměrně málo flexibilní a v některých úlohách dosahovala nižšího výkonu než její předchůdce, Fermi.
Koncem roku 2013 byl Big Red 2 rozebrán, aby uvolnil místo pro Big Red 200, přinejmenším 8× rychlejšího nástupce, který se stane nejrychlejším superpočítačem v majetku vysoké školy. Ten bude založen na Cray Shasta a jeho vznik rozdělen do dvou etap. První zakládá čistě na 64jádrových procesorech AMD Epyc 7742 ze 7nm generace Rome (architektura Zen 2), kterými je osazeno 672 dvousocketových uzlů. Tato fáze je již v provozuschopném stavu. Do léta dojde na druhou fázi, kdy budou doplněny další uzly s Epyc Rome, ovšem tentokrát doplněnou akcelerátory. Původně mělo jít o Nvidia GPU GV100 (Tesla V100), ale to se mění a namísto Volty bude osazena nová generace, o níž se zatím mluví jakožto o Ampere.
Tyto akcelerátory budou doplněny v létě, což znamená, že zhruba v polovině roku bude Nvidia schopná dodávat výpočetní GPU generace Ampere. Podle starších zpráv měla výpočetní verze Volty dorazit s předstihem před herní - jak to bude nakonec, není známo. Lze však čekat, že v případě distribuce výpočetních čipů v létě naplánuje Nvidia představení (přinejmenším) výpočetní části architektury v na GPU Technology Conference (neděle 22. až čtvrtek 26. března 2020).
Pokud jde o samotné GPU, dozvídáme se pouze to, že bude o 70-75 % rychlejší než přímý předchůdce, Volta GV100. Celý systém bude 8× rychlejší než původní konfigurace z roku 2013, ale musíme vzít v potaz, že toto srovnání musí být vyčísleno na FP32 výkonu (neboť Kepler FP16, Int8 atd. nepodporoval), takže reálný výkon při využití těchto možností může být vyšší v řádu desetinásobků.