AMD představila Instinct MI325X HBM3e a ohlásila 3nm CDNA4 MI350X na příští rok
O refreshi CDNA 3 se psalo dlouho, bohužel se z důvodu nejasného značení (CDNA 3 i CDNA 4 jsou součástí akcelerátorů Instinct MI300) pomíchaly informace o CDNA 3-refresh a CDNA 4. To se sice později vysvětlilo, ale teprve nyní AMD první ze zmíněných vydává a druhý ohlašuje.
Instinct MI325X
Aktuálně vydaný Instinct MI325X je vylepšením Instinct MI300X. Vychází tedy ze stejné architektury a v zásadě i ze stejného návrhu. Oproti Instinct MI300X, která byla osazena 5,2Gb/s HBM3 o kapacitě 192 GB nese Instinct MI325X 5,9Gb/s HBM3e o kapacitě 256 GB. Tato změna pomůže tam, kde je výkon limitován datovou propustností (+13,5 %) nebo kapacitou (+33,3 %).
Instinct MI325X (AMD)
Není to ale vše. AMD poslední dobou výrazně zvyšuje investice do softwarové podpory a ty začínají nést ovoce. Vylepšováním platformy ROCm došlo s nasazením verze ROCm 6.2 u některých zátěží k téměř dvojnásobnému zrychlení tréningu a i více než dvojnásobnému zrychlení v inferenci. Pro AMD má vydání refresh význam i v tom, že se potenciální zákazníci nebudou řídit podle rok starých testů provedených na tehdejší softwarové platformě, ale s novým hardwarem vezmou v potaz i aktuální software.
Vylepšení platformy ROCm (AMD)
AMD oznámila, že v současném kvartálu rozbíhá distribuci Instinct MI325X, přičemž dostupnost hotových systémů od jednotlivých výrobců očekává v prvním kvartálu 2025.
CDNA 4 / Instinct MI350X
Na druhé pololetí roku 2025 ohlásila AMD architekturu CDNA 4 a akcelerátor Instinct MI350X. Přinese 80% zvýšení výkonu ve stávajících formátech FP16 a FP8 a nově přijde s podporou formátů FP6 a FP4, jejichž akcelerace bude 2× výkonnější oproti FP8. Pro výpočty, kterým dostačuje přesnost FP6 nebo FP4 to znamená, že budou na Instinct MI350X prováděné až 3,6× rychleji než na MI300X / MI325X.
CDNA 4 / Instinct MI350 (AMD)
Ke zvýšení výkonu přispěje i nasazení rychlejších pamětí HBM3e, celková propustnost rozhraní stoupne z 6 TB/s (Instinct MI325X) na cca 8 TB/s. Mírně stoupne i kapacita, z 256 GB na 288 GB.
CDNA 4 / Instinct MI355X (AMD)
Lze očekávat i zlepšení energetické efektivity, z 5nm procesu TSMC se výpočetní čiplety přesunou na 3nm proces, což by při využití továren téže značky znamenalo plný generační posun.
AMD