Instinct MI430X, nejrychlejší HPC akcelerátor na světě, v FP64 6× překoná Rubin
Přestože se vedení Nvidie dlouhodobě snažilo vytvořit dojem, že klasický výpočetní segment zaniká nebo je minulostí, je realita odlišná. Dlouhodobě roste, sice ne zdaleka tak rychle jako AI segment, ale roste, zhruba o 10 % ročně. Do klasického výpočetního segmentu se zpravidla řadí i superpočítače, které se na tomto trhu podílí asi z 25 %. Tato čísla ilustrují, že i když lze říct, že se v řadě systémů AI a HPC zátěže sdružují, klasické HPC a poptávka po zpracování FP64 vektorů neklesá, ale naopak roste.
Zájem je takový, že se AMD rozhodla pro tento segment vyvinout vlastní řadu akcelerátorů, odlišnou od AI řešení (Instinct MI450X), která na rozdíl od nich dále expanduje co do výkonu v FP64. Že Instinct MI430X bude mít něco společného s FP64, jsme vás už informovali. Nyní však AMD zveřejnila, že Instinct MI430X bude mít 6× vyšší HPC / FP64 výkon než Nvidia Rubin, což znamená úroveň kolem 300 TFLOPS.
| FP64 (HPC) | |||||||
|---|---|---|---|---|---|---|---|
| AMD | MI100 | MI210 | MI250X | MI300A | MI300X | MI355X | MI430X |
| TFLOPS | 11,5 | 22,6 | 47,9 | 61,3 | 81,7 | 78,6 | ~300 |
| Nvidia | Volta | Ampere | Hopper | Blackwell | Rubin | ||
| TFLOPS | 7,8 | 9,7 | 34 | 40 | 33 | ||
Pozici oproti ostatním produktům a generacím si můžete srovnat v tabulce výše. Berte v potaz, že tabulka neodráží a nemůže odrážet přesné časové zařazení, protože konkurenční produkty v tomto segmentu nevycházejí zároveň a datum vydání navíc často nekoresponduje s datem reálné dostupnosti. Chronologické pořadí produktů jednotlivých výrobců ale odpovídá.
Z tabulky vyplývá, že AMD navyšovala FP64 výkon až do generace MI300X (CDNA 3), zatímco u Nvidie se již od (v tabulce ještě nezařazeného) Pascalu, přes Voltu až po Ampere držela hodnota v rozpětí vyšších jednotek TFLOPS (5-9,9). S Hopper sice jednorázově poskočila, ale Hopper počínaje již tři generace opět stagnuje a nabízí zhruba 2-2,5× nižší výkon.
Superpočítač Discovery, první ohlášený projekt s Instinct MI430X (AMD)
AMD klasické superpočítače zásobovala především generacemi CDNA 2 (MI250X) a CDNA 3 (MI300X). Od instalace takového Frontieru, sestaveného v roce 2021, letos uteče 5 let a začátkem příštího roku to bude 5 let od plného uvedení do provozu. Po takové době již zákazníci opět hledají upgrade. 40 TFLOPS Blackwellu nebo 33 TFLOPS Rubinu by pro ně oproti 48 TFLOPS Instinct MI250X znamenalo downgrade, navíc za násobně vyšší cenu. Tím se AMD bez vlastního přičinění dostala do fakticky monopolního postavení na trhu klasických HPC GPGPU akcelerátorů. Nvidia jej opustila (při cenách nastavených podle AI trhu nemá FP64 výkon na úrovni 5-6 let starých Instinctů žádnou konkurenceschopnost) a Intel do něj (v důsledku systematického zrušení několika generací akcelerátorů) prakticky ani nevstoupil.
Instinct MI430X tak bude řešením pro zákazníky, kteří potřebují cokoli rychlejšího pro HPC. Zároveň však nejde o čistě HPC řešení, ale disponuje i obvody pro AI akceleraci stejně jako řady MI450X, takže může sloužit i pro systémy, od kterých se čeká bezkonkurenční HPC výkon + velmi vysoký AI výkon.
- AMD získala zakázky od DoE na dva superpočítače s Instinct MI355X a MI430
- AMD vybaví evropský exascale superpočítač Alice Recoque Zen 6 a Instinct MI430X
Již je známo, že na akcelerátorech Instinct MI430X vznikne superpočítač Discovery, který má být více než 3× výkonnější oproti zmíněnému Frontieru (už to by ho v současnosti pasovalo s přehledem na nejvýkonnější superpočítač světa). Dále se Instinct MI430X objeví v evropském Alice Recoque, kde mu ještě budou sekundovat FPGA akcelerátory AMD, tzn. z dílen bývalého Xilinxu. AMD by se měla dodávkami hardwaru podílet také na superpočítačích pro HLRS, CSCS nebo iniciativě KRITIS. V těchto případech nelze použití Instinct MI430X vyloučit, ale konkrétní hardware zatím nebyl oficiálně potvrzen, takže možnost nasazení konkrétní verze Instinct zůstává otevřená.
Diskuse ke článku Instinct MI430X, nejrychlejší HPC akcelerátor na světě, v FP64 6× překoná Rubin





















