Atos začne pracovat na EFLOPS systému s hardwarem Nvidie
16. listopadu vyšel na webu The Next Platform rozhovor s CEO společnosti Nvidia Jen-Hsun Huangem, ve kterém si redaktor neodpustil narážky na téma akcelerátorů AMD Instinct MI250X, zakázek na stavbu EFLOPS systémů, které AMD jako dodavatel procesorů a akcelerátorů získala, a zkrátka konkurenční pozici. V době vzniku tohoto rozhovoru neexistovaly ani náznaky informací o tom, že by nějakou zakázku na EFLOPS systém získala Nvidia. CEO odpovídal bagatelizování slovního spojení „Nvidia killer“, které však redaktor nepoužil a konstatováním, že konkurence tu byla vždycky, nějaký „Nvidia killer“ přichází každý rok a podobně. Přesto připustil, že konkurence je nyní vážně silná („seriously intense“).
Můžeme jen spekulovat, jaký vliv měl tento rozhovor a poměrně nepříjemné otázky na nadcházející události, ale ty se odehrály následovně:
18. listopadu vydala společnost Atos tiskovku, že s Nvidií připraví EFLOPS systém. Tento systém není výsledkem vítězství v nějaké zakázce (jako AMD Frontier, Intel Aurora, AMD El Capitan ap.), ale čistě rozhodnutím Nvidie a Atos postavit superpočítač, který bude součástí iniciativy nazvané Excellence AI Lab (EXAIL). Ta má sdružit evropské vědce a výzkumníky zaměřené především na klima a zdravotnictví, kteří nějakým způsobem budou mít zpřístupněn výpočetní výkon tohoto superpočítače.
Nedozvídáme se však, jakého konkrétního výkonu tento systém bude dosahovat, na jakých akcelerátorech bude postaven, ani kdy se plánuje jeho dokončení. Má jít o systém třídy BullSequana X, procesory budou vycházet z architektury Nvidia Grace (ARM), akcelerátory Nvidie budou z neupřesněné budoucí generace a jednotlivé prvky propojí Atos BXI Exascale Interconnect v kombinaci s Nvidia Quantum-2 InfiniBand.
Tiskovka dále uvádí, že „Atos bude vyvíjet…“, takže je možné, že se ptáme na parametry, které zatím ani nebyly stanoveny a v tuto chvíli nejde o víc než jen rozhodnutí, že obě společnosti nějaký EFLOPS systém připraví. Pokud bychom chtěli alespoň orientační datum jeho dokončení, můžeme z informace o použití nějaké budoucí generace akcelerátorů usuzovat, že půjde o generaci Hopper. Očekává se, že ohlásit by ji Nvidia mohla v polovině příštího roku, ale nezdá se pravděpodobné, že by EFLOPS systém na ní postavený mohl být na světě dříve než v roce přespříštím. Tedy 2023.
superpočítač | komplet. | výkon FP64 | spotř. | CPU | (GP)GPU |
---|---|---|---|---|---|
Summit | 2018 | 0,2 EFLOPS | 13 MW | IBM | Nvidia |
Sierra | 2018 | 0,125 EFLOPS | 11 MW | IBM | Nvidia |
Perlmutter | 2020 | 0,1 EFLOPS | 21,5 MW | AMD | Nvidia |
HPC Mega-Project | ? | 0,275 EFLOPS | ? | AMD | AMD |
Fugaku | 2021 | 0,415 EFLOPS | 18 MW | Fujitsu | - |
Frontier | 2021 | >1,5 EFLOPS | 27 MW | AMD | AMD |
Oceanlite | 2021 | 1,3 EFLOPS | 35 MW | SW26010 | - |
Tianhe-3 | 2021 | 1,3 EFLOPS | ? | FeiTeng | - |
Aurora | 2022? | ~2,4 EFLOPS | 60 MW | Intel | Intel |
El Capitan | 2022/23 | >2 EFLOPS | 33 MW | AMD | AMD |
? (pro EXAIL) | 2023? | ? EFLOPS | ? | Nvidia | Nvidia |
Krom toho byl ještě ohlášen tzv. JUWELS Booster system postavený na Atos BullSequana XH2000 platformě „s téměř 2,5 EFLOPS AI“ a 3744× Nvidia A100 Tensor Core GPU a Nvidia Quantum InfiniBand.
Přeloženo z marketingového jazyka do jazyka superpočítačů půjde o systém o výkonu necelých 39 PFLOPS. Ďábel tkví v detailu, tedy v poznámce „AI“. Ta naznačuje, že 2,5 EFLOPS není univerzální výpočetní výkon ani výkon v tradičně uváděné přesnosti FP64. Z množství akcelerátorů (3744) lze snadno dopočítat, že oněch 2,5 EFLOPS se vztahuje k tenzorovým operacím v přesnosti Int8.