Éra EFLOPS je tu: Intel zrychlí Auroru na 2 EFLOPS, v Číně už mají EFLOPS stroje
Jak to bylo se superpočítačem Aurora, asi tušíte. Pokud ne, tak jen krátká rekapitulace: V roce 2015 jej Intel ohlásil, pak se zpozdil z důvodu zdržení akcelerátorů Xeon Phi (deriváty Larrabee). Časem bylo zpoždění tak velké, že by původně vyžadovaná konfigurace neměla smysl a zadavatel žádal podporu pro akceleraci umělé inteligence. To tehdejší Xeony Phi nepodporovaly a nová generace čekala na 10nm proces, pak už nemělo smysl čekat a byla zcela zrušena. Projekt Aurora byl v dané podobě zrušen a kompletně přepracován. Vypadalo to, že bude prvním EFLOPS strojem. Jenže čeká na zpožděné Xeony Sapphire Rapids i zpožděné akcelerátory Xe. Podle dostupných informací to vypadá, že namísto spuštění Aurory v roce 2021 se požadovaný hardware teprve začne vyrábět někdy na jaře 2022.
Mezi tím byly zkompletovány kabinety superpočítače Frontier postaveného na hardwaru AMD, které se na přelomu září a října navezly do finálních prostor, kde probíhá jejich zapojení a spuštění. Krom toho, že Frontier má snad více než roční náskok oproti Auroře, cílí na 1,5 EFLOPS na rozdíl od 1 EFLOPS Aurory.
Frontier při instalaci koncem září 2021
Aby toho nebylo málo, došlo v Číně k rozběhnutí dvou systémů, které (každý zvlášť) v testu Linpack dosahují špičkového výkonu kolem 1,3 EFLOPS a kontinuálního výkonu lehce nad 1 EFLOPS. První je nástupcem Sunway TaihuLight a nese označení Sunway Oceanlite. Energetické nároky odpovídají 35 MW a výkon v FP16 4,4 EFLOPS. Druhým je Tianhe-3 s procesory řady FeiTeng od společnosti Phytium, což je ARM řešení s maticovými akcelerátory.
Den poté, co vyšlo najevo, že Čína má (respektive stále rozšiřuje / dokončuje) dva systémy dosahující špičkového výkonu 1,3 EFLOPS a v USA je dokončován systém s hardwarem AMD cílící na 1,5 EFLOPS, ohlásil Intel, že Aurora bude zrychlena (z v roce 2019 uváděných) 1 EFLOPS na 2 EFLOPS. Připomeňme, že původní cíl Aurory (2015) bylo překonat 180 PFLOPS. Od té doby už cíl pouze roste a hotový produkt se stále vzdaluje původnímu datu.
Zlí jazykové by mohli tvrdit, že se Intel s rozhodnutím zvýšit výkon Aurory na 2 EFLOPS řídí heslem „nikdo Vám nedá tolik, kolik my Vám můžeme slíbit“, ale není to pravda. Krom Aurory vzniká i superpočítač El Capitan vybavený hardwarem AMD, který se rovněž usadí na úrovni 2 EFLOPS, ovšem při téměř poloviční spotřebě.
superpočítač | komplet. | výkon FP64 | spotř. | CPU | (GP)GPU |
---|---|---|---|---|---|
Summit | 2018 | 0,2 EFLOPS | 13 MW | IBM | Nvidia |
Sierra | 2018 | 0,125 EFLOPS | 11 MW | IBM | Nvidia |
Perlmutter | 2020 | 0,1 EFLOPS | 21,5 MW | AMD | Nvidia |
HPC Mega-Project | ? | 0,275 EFLOPS | ? | AMD | AMD |
Fugaku | 2021 | 0,415 EFLOPS | 18 MW | Fujitsu | - |
Frontier | 2021 | >1,5 EFLOPS | 27 MW | AMD | AMD |
Oceanlite | 2021 | 1,3 EFLOPS | 35 MW | SW26010 | - |
Tianhe-3 | 2021 | 1,3 EFLOPS | ? | FeiTeng | - |
Aurora | 2022? | >2 EFLOPS | 60 MW | Intel | Intel |
El Capitan | 2023 | >2 EFLOPS | 3x MW | AMD | AMD |
Při porovnávání spotřeby superpočítačů mějte na paměti, že ne všechna uvedená čísla jsou vyhodnocena stejnou metodikou. Někde jde o dimenzování napájecích obvodů, jinde o reálně naměřenou spotřebu. Mnohde se údaje během vývoj mění. Například ve starších článcích o superpočítači Frontier byl uveden údaj, že napájecí / chladící zázemí bude dimenzováno na 40 MW. Během loňského roku následovaly zpráva, že spotřeba skončí blíže 30 MW a již koncem roku přišla informace, že napájení bude dimenzováno jen na 28 MW, což potvrzuje čerstvá zpráva, podle které je chlazení dimenzováno na 26-27, respektive 26-28 MW.
Vraťme se k pozici Aurory. Intel přišel opakovanými odklady o pozici prvního EFLOPS systému a vlastně i druhého a třetího. Je však pravdou, že aktuálně dostupná data o čínských systémech naznačují, že efektivita mimo benchmark Linpack (který již dávno neodráží reálné požadavky soudobého softwaru) bude násobně horší než u tabulkou zmíněných x86 / IBM / Fujitsu systémů. Stejně tak je ale pravda, že to nic nemění na pozici v „EFLOPS race“. Zde však nemůžeme vinit jen samotný Intel, který kolem roku 2015 zaspal a nyní dohání, co se dá. Čínskou konkurenci si doslova vypěstovala americká vláda, která roku 2014 vydala dokument podmiňující vývoz procesorů Xeon a Xeon Phi do Číny udělením vládní licence. Zprvu úřad licence vydával, ale v únoru 2015 přestal. Formálním důvodem měly být údajné jaderné simulace, které měla Čína provádět na superpočítačích Tianhe-1 a Tianhe-2:
Ve skutečnosti šlo jen o záminku (USA se nijak netají tím, že na superpočítači El Capitan budou provádět vlastní jaderné simulace), jejímž cíle bylo Číně omezit přísun moderního hardwaru. To však politické vedení Číny vedlo k sešlápnutí pedálu vývoje vlastního hardwaru, který se po šesti letech zčal projevovat faktem, že Čína má k dispozici dva EFLOPS systémy v době, kdy se v USA první spouští a o dalších dvou mluví. Pokud by Spojené státy namísto omezení vývozu zahájeného v roce 2015 nadále hardware dodávaly, mohly mít nejen příjmy z vývozu, ale v současnosti i Čínu podstatně více závislou na americkém hardwaru. Současná situace však nemusí být konečným stavem, mohutné investice do vývoje vlastního hardwaru zahájené v důsledku zmíněného banu mohou dospět do fáze, kdy Čína začne vlastní superpočítače vyvážet a konkurovat západu nejen na vlastním trhu, ale i ve zbytku světa.