AMD postaví superpočítač výkonnější, než top-200 superpočítačů dohromady
O tom, že americký úřad Department of Energy (DOE) chystá skutečně velký superpočítač El Capitan se vědělo. Respektive DOE těch superpočítačů chystá více, ale El Capitan měl mít nejvyšší ohlášený výkon ze všech (ohlášených), konkrétně 1,5 EFLOPS (ExaFLOPS). Což je více než v případě zakázky na 1 EFLOPS superpočítač Aurora, kterou získal Intel v roce 2015.
Tehdy ještě bylo cílem 180 PTFLOPS s možností budoucího rozšíření na 450 PTFLOPS, ale protože vývoj Intelu vázl a nebyl schopný v očekávaném čase dodat hardware dosahující smluvených parametrů, byl projekt opakovaně zrušen (spíše než Auroru tak připomínal Titanic), přepracováván a jak plynul čas, rostly i nároky na výkon hardwaru. Když byl projekt naposledy restartován (v březnu 2019, tedy akorát před rokem), byl nastaven nový cíl v podobě 1 EFLOPS. Kompletace Aurory se očekává do konce roku 2021.
V tomto kontextu byl cíl 1,5 EFLOPS pro superpočítač El Capitan ještě majestátnější. Vědělo se, že se o jeho realizaci uchází všichni tři velcí hráči PC světa - AMD, Intel i Nvidia. Názory analytiků na očekávaný výsledek byly vcelku jednoznačné - očekávalo se vítězství Nvidie.
S oficiálním oznámením výsledku ale přišlo překvapení. Vlastně přišla překvapení, protože nebylo zdaleka jedno:
- Zakázku vyhrála AMD.
- Celou: jak procesory, tak akcelerátory.
- AMD s ohledem na plánovanou kompletaci 2022 a spuštění 2023 nabídla rovnou Zen 4.
- DOE se po zhodnocení výkonu a ceny hardwaru AMD rozhodla rozšířit výkon na 2 EFLOPS.
Z majestátního cíle 1,5 EFLOPS, který by byl o polovinu nad projektem Aurora, tak vznikl cíl rovný dvojnásobku projektu Aurora. Superpočítač bude vybaven procesory Epyc generace Genoa s jádry Zen 4 a akcelerátory Radeon Instinct neupřesněné z nadcházejících generací. Celý systém se vším všudy (ne jen CPU a GPU) vyjde na $600 milionů. Jde o velmi příjemnou cenu s ohledem na fakt, že na 1EFLOPS Auroru je aktuálně rozpočet $500 milionů.
S cílem 2 EFLOPS jde o výkon vyšší, než jakého dosahuje 200 nejvýkonnějších aktuálně fungujících superpočítačů dohromady. Vezmeme-li v potaz, že v 500 nejvýkonnějších superpočítačích současnosti se nejčastěji objevují akcelerátory Nvidie, nelze se mylné prognóze analytiků příliš divit. Zvlášť když k tomu připočteme, že jedním z primárních cílů systému je umělá inteligence, na které si Nvidia s posledními generacemi výpočetních architektur (Pascal, Volta a nadcházející Ampere) zakládá.
Specialisté z DOE ale nehodnotili na základě informací, které jsou veřejnosti známé nyní, ale měli od všech tří klíčových výrobců na papíře specifikace hardwaru, který bude k dispozici za dva roky. Co konkrétně by to mohlo být v případě AMD, vzdáleně nastínil dr. Bradley McCredie. Toto jméno si možná s AMD spojovat nebudete, do společnosti nastoupil (přestoupil) v poslední době z IBM společně s dalšími osobnostmi jako jsou Dan McNamara (z Intelu, z Altery) a Joshua Friedrich (z IBM, kde se podílel na architekturách Power5 až Power9). McCredie, již jako vice-prezident AMD pro GPU platformy (pro výpočetní segment, ovšem přes tento titul bude spoluzodpovídat i za strategii CPU ve výpočetním segmentu) letos vedl prezentaci na Oil and Gas HPC Conference na Rice University, kde promítl několik zajímavých slajdů:
Krom prezentace výhod, které přináší kombinování procesorů a GPGPU akcelerace, zmínil jednu velmi zajímavou věc a to podporu koherentní paměti u GPU, která může mimo jiné přinést v konkrétních případech zjednodušení kódu na úroveň kódu pro procesory.
Více ale známo není, o Radeonech, kterými bude El Capitan vybaven, hovoří AMD pouze jako o „nové výpočetní architektuře“ vybavené „novou generací HBM pamětí“, podporující „mixed precision“ a vybavenou rozhraním „Infinity Fabric pro propojení CPU a GPU“.
S generací Zen 4 lze očekávat nasazení PCIe 5.0 a DDR5, ale ve veřejných materiálech projektu El Capitan je zmíněno pouze „více než DDR4“, takže jde stále o očekávání, nikoli oficiálně potvrzený fakt. O realizaci unifikované koherentní paměti mezi procesorem Epyc Genoa s jádry Zen 4 a výpočetními akcelerátory Radeon Instinct příští generace se bude starat Infinity Fabric 3.0, nadcházející architektura sloužící k vysokorychlostnímu propojení výpočetních prvků.
Po energetické stránce měla DOE limit na trvalou spotřebu v zátěži do 40 MW, ovšem řešení od AMD, byť navýšené z 1,5 na 2 EFLOPS, by podle DOE měly stačit hodnoty bližší 30 MW než limitním 40 MW. Procesory a akcelerátory budou nainstalované v rámci široce využívaného systému Cray Shasta. Ten v současnosti propojují 200Gb/s porty postavené na ASIC od Cray, ale v případě El Capitan bude použito cosi neupřesněného novějšího, tedy patrně i rychlejšího.
El Capitan s výkonem 2 EFLOPS nahradí (v době jeho dokončení) dosluhující systém Sierra, který stojí na hardwaru IBM a Nvidie, a který je aktuálně druhým nejvýkonnějším superpočítačem světa, oproti El Capitan však 16× pomalejší.
Oproti v současnosti nejrychlejšímu superpočítači, Summit (IBM + Nvidia Volta) bude El Capitan 10× rychlejší. AMD v tuto chvíli získala dvě z celkem tří existujících zakázek na EFLOPS superpočítače, což poukazuje na sílu kombinace výkonných procesorů a výkonných grafických akcelerátorů, což je v současnosti prvek, který není schopný nabídnout žádný z konkurentů.