Diit.cz - Novinky a informace o hardware, software a internetu

AMD postaví superpočítač výkonnější, než top-200 superpočítačů dohromady

Zatímco čekáme na podzimní vydání Zen 3, získala AMD zakázku na nejvýkonnější ohlášený superpočítač světa, který bude postaven na přespříští generaci procesorů Zen 4 a akcelerátorech Radeon Instinct…

O tom, že americký úřad Department of Energy (DOE) chystá skutečně velký superpočítač El Capitan se vědělo. Respektive DOE těch superpočítačů chystá více, ale El Capitan měl mít nejvyšší ohlášený výkon ze všech (ohlášených), konkrétně 1,5 EFLOPS (ExaFLOPS). Což je více než v případě zakázky na 1 EFLOPS superpočítač Aurora, kterou získal Intel v roce 2015.

Tehdy ještě bylo cílem 180 PTFLOPS s možností budoucího rozšíření na 450 PTFLOPS, ale protože vývoj Intelu vázl a nebyl schopný v očekávaném čase dodat hardware dosahující smluvených parametrů, byl projekt opakovaně zrušen (spíše než Auroru tak připomínal Titanic), přepracováván a jak plynul čas, rostly i nároky na výkon hardwaru. Když byl projekt naposledy restartován (v březnu 2019, tedy akorát před rokem), byl nastaven nový cíl v podobě 1 EFLOPS. Kompletace Aurory se očekává do konce roku 2021.

V tomto kontextu byl cíl 1,5 EFLOPS pro superpočítač El Capitan ještě majestátnější. Vědělo se, že se o jeho realizaci uchází všichni tři velcí hráči PC světa - AMD, Intel i Nvidia. Názory analytiků na očekávaný výsledek byly vcelku jednoznačné - očekávalo se vítězství Nvidie.

S oficiálním oznámením výsledku ale přišlo překvapení. Vlastně přišla překvapení, protože nebylo zdaleka jedno:

  1. Zakázku vyhrála AMD.
  2. Celou: jak procesory, tak akcelerátory.
  3. AMD s ohledem na plánovanou kompletaci 2022 a spuštění 2023 nabídla rovnou Zen 4.
  4. DOE se po zhodnocení výkonu a ceny hardwaru AMD rozhodla rozšířit výkon na 2 EFLOPS.

Z majestátního cíle 1,5 EFLOPS, který by byl o polovinu nad projektem Aurora, tak vznikl cíl rovný dvojnásobku projektu Aurora. Superpočítač bude vybaven procesory Epyc generace Genoa s jádry Zen 4 a akcelerátory Radeon Instinct neupřesněné z nadcházejících generací. Celý systém se vším všudy (ne jen CPU a GPU) vyjde na $600 milionů. Jde o velmi příjemnou cenu s ohledem na fakt, že na 1EFLOPS Auroru je aktuálně rozpočet $500 milionů.

S cílem 2 EFLOPS jde o výkon vyšší, než jakého dosahuje 200 nejvýkonnějších aktuálně fungujících superpočítačů dohromady. Vezmeme-li v potaz, že v 500 nejvýkonnějších superpočítačích současnosti se nejčastěji objevují akcelerátory Nvidie, nelze se mylné prognóze analytiků příliš divit. Zvlášť když k tomu připočteme, že jedním z primárních cílů systému je umělá inteligence, na které si Nvidia s posledními generacemi výpočetních architektur (Pascal, Volta a nadcházející Ampere) zakládá.

Specialisté z DOE ale nehodnotili na základě informací, které jsou veřejnosti známé nyní, ale měli od všech tří klíčových výrobců na papíře specifikace hardwaru, který bude k dispozici za dva roky. Co konkrétně by to mohlo být v případě AMD, vzdáleně nastínil dr. Bradley McCredie. Toto jméno si možná s AMD spojovat nebudete, do společnosti nastoupil (přestoupil) v poslední době z IBM společně s dalšími osobnostmi jako jsou Dan McNamara (z Intelu, z Altery) a Joshua Friedrich (z IBM, kde se podílel na architekturách Power5 až Power9). McCredie, již jako vice-prezident AMD pro GPU platformy (pro výpočetní segment, ovšem přes tento titul bude spoluzodpovídat i za strategii CPU ve výpočetním segmentu) letos vedl prezentaci na Oil and Gas HPC Conference na Rice University, kde promítl několik zajímavých slajdů:

Krom prezentace výhod, které přináší kombinování procesorů a GPGPU akcelerace, zmínil jednu velmi zajímavou věc a to podporu koherentní paměti u GPU, která může mimo jiné přinést v konkrétních případech zjednodušení kódu na úroveň kódu pro procesory.

Více ale známo není, o Radeonech, kterými bude El Capitan vybaven, hovoří AMD pouze jako o „nové výpočetní architektuře“ vybavené „novou generací HBM pamětí“, podporující „mixed precision“ a vybavenou rozhraním „Infinity Fabric pro propojení CPU a GPU“.

S generací Zen 4 lze očekávat nasazení PCIe 5.0 a DDR5, ale ve veřejných materiálech projektu El Capitan je zmíněno pouze „více než DDR4“, takže jde stále o očekávání, nikoli oficiálně potvrzený fakt. O realizaci unifikované koherentní paměti mezi procesorem Epyc Genoa s jádry Zen 4  a výpočetními akcelerátory Radeon Instinct příští generace se bude starat Infinity Fabric 3.0, nadcházející architektura sloužící k vysokorychlostnímu propojení výpočetních prvků.

Po energetické stránce měla DOE limit na trvalou spotřebu v zátěži do 40 MW, ovšem řešení od AMD, byť navýšené z 1,5 na 2 EFLOPS, by podle DOE měly stačit hodnoty bližší 30 MW než limitním 40 MW. Procesory a akcelerátory budou nainstalované v rámci široce využívaného systému Cray Shasta. Ten v současnosti propojují 200Gb/s porty postavené na ASIC od Cray, ale v případě El Capitan bude použito cosi neupřesněného novějšího, tedy patrně i rychlejšího.

El Capitan s výkonem 2 EFLOPS nahradí (v době jeho dokončení) dosluhující systém Sierra, který stojí na hardwaru IBM a Nvidie, a který je aktuálně druhým nejvýkonnějším superpočítačem světa, oproti El Capitan však 16× pomalejší.

Oproti v současnosti nejrychlejšímu superpočítači, Summit (IBM + Nvidia Volta) bude El Capitan 10× rychlejší. AMD v tuto chvíli získala dvě z celkem tří existujících zakázek na EFLOPS superpočítače, což poukazuje na sílu kombinace výkonných procesorů a výkonných grafických akcelerátorů, což je v současnosti prvek, který není schopný nabídnout žádný z konkurentů.

Zdroje: 

Diskuse ke článku AMD postaví superpočítač výkonnější, než top-200 superpočítačů dohromady

Neděle, 8 Březen 2020 - 06:55 | Cotije Dotoho | Mozna prave proto je v materialech prezentovan...
Pátek, 6 Březen 2020 - 16:54 | Libor Bauer | Zminil bych tady neco co nikdo neuvedl: pruzkum...
Čtvrtek, 5 Březen 2020 - 23:32 | ldx | Vypadá to na jiný způsob realizace The Machine...
Čtvrtek, 5 Březen 2020 - 23:26 | ldx | Těch aplikací, které by takový výkon využilo je...
Čtvrtek, 5 Březen 2020 - 22:15 | Tralalák | Domnievam sa, že Číňania sa budú chcieť ukázať...
Čtvrtek, 5 Březen 2020 - 21:54 | JirkaK | Tak nejvýkonnější počítač v číně, 3. na světě je...
Čtvrtek, 5 Březen 2020 - 21:30 | Tralalák | Čína superpočítače postaví na bázi v clustroch 32...
Čtvrtek, 5 Březen 2020 - 21:13 | no-X | Já doufám, že to k masivnímu nárůstu latencí...
Čtvrtek, 5 Březen 2020 - 20:06 | Pjetro de | fujtable, retail trh by do desktopov zacal...
Čtvrtek, 5 Březen 2020 - 18:51 | super master | ta koherentni pamet = propojeni GPU s CPU a RAM...

Zobrazit diskusi