Superpočítač El Capitan budou pohánět „APU“ Instinct MI300
Zakázku na superpočítač El Capitan získala AMD před dvěma lety. Oznámení této skutečnosti bylo překvapením, analytici se totiž shodovali na tom, že ji získá Nvidia. Nakonec vyhrála AMD a to jak na akcelerátory, tak procesory. Dnes již víme, že dělení mezi různé výrobce nemělo smysl i z toho důvodu, že El Capitan bude pohánět výpočetní APU Instinct řady MI300. Jde o spojení procesorových jader Zen 4, akcelerátoru CDNA 3, cache čipletů (zatím není jasné, jestli plošně umístěných nebo navrstvených v podobě V-cache) a HBM3 pamětí.
Vzhledem k tomu, že zakázka byla původně dimenzovaná na výkon 1,5 EFLOPS a AMD nabídla hardware za nižší cenu, se zadavatel později rozhodl systém rozšířit na ~2 EFLOPS.
superpočítač | komplet. | výkon FP64 | spotř. | CPU | (GP)GPU |
---|---|---|---|---|---|
Summit | 2018 | 0,2 EFLOPS | 13 MW | IBM | Nvidia |
Sierra | 2018 | 0,125 EFLOPS | 11 MW | IBM | Nvidia |
Perlmutter | 2020 | 0,1 EFLOPS | 21,5 MW | AMD | Nvidia |
HPC Mega-Project | ? | 0,275 EFLOPS | ? | AMD | AMD |
Fugaku | 2021 | 0,415 EFLOPS | 18 MW | Fujitsu | - |
Frontier | 2021 | ~2,0 EFLOPS | 27 MW | AMD | AMD |
Oceanlite | 2021 | 1,3 EFLOPS | 35 MW | SW26010 | - |
Tianhe-3 | 2021 | 1,3 EFLOPS | ? | FeiTeng | - |
Aurora | 2023 | ~2,4 EFLOPS | 60 MW | Intel | Intel |
El Capitan | 2023 | >2 EFLOPS | 33 MW | AMD | AMD |
? (pro EXAIL) | 2023? | ? EFLOPS | ? | Nvidia | Nvidia |
Z důvodu různých komplikací a zpoždění, které nastaly v předchozích letech (covid, logistické potíže, nedostatek substrátů a materiálů vůbec ap.) nedojde ke kompletaci na přelomu let 2022 / 2023, ale koncem roku 2023.
Instinct MI300
Krom výše řečeného potvrdila AMD na letošním FAD, že MI300 bude zaměřená na zátěže vyžadující minimální latence a energetickou efektivitu vyšší oproti tradiční diskrétní kombinaci samostatných procesorů a samostatných akcelerátorů. Sloučení totiž eliminuje velké objemy datových přenosů. Krom toho architektura CDNA 3 přinese podporu nových formátů, mezi jinými FP8, takže výpočty vyžadující tuto přesnost budou akcelerovány >8× rychleji.
Terri Quinn z LLNL nic bližšího neprozradil. Uváděl velmi obecné údaje a konzervativní hodnoty…
„Nemohu vám dát kompletní specifikace, ale [El Capitan] je alespoň 10× lepší než Sierra v průměrném výkonu. Teoretické maximum jsou dva exaflops FP64 a budeme to držet po 40 megawatty - ze stejného důvodu jako Oak Ridge, tedy kvůli provozním nákladům.“
…navzdory tomu, že již bylo potvrzeno, že těchto „méně než 40 MW“ je 33 MW a že výkon bude dosahovat přes 2 EFLOPS.
Souputníkem tohoto systému bude Aurora postavená na hardwaru společnosti Intel. Vzhledem k tomu, že vyšlo najevo, že procesory Sapphire Rapids (na nichž má Aurora stát) nejspíš letos nebudou dostupné (a o akcelerátorech Xe-HPC se taky příliš nemluví), můžeme považovat za vyloučené, že by Aurora mohla být zkompletována a předána k užívání v letošním roce.