Instinct MI400 / UDNA nese 8 výpočetních čipletů + 2 multimediální akcelerátory
CDNA (Instinct MI100) byla monolitická architektura, CDNA 2 (Instinct MI200) rozdělila křemík na dva čiplety a CDNA 3 (Instinct MI300) na osm výpočetních čipletů, které jsou umístěny po dvojicích na čtyřech podložkách nesoucích cache. Na podzim vydaný Instinct MI325X je v podstatě Instinct MI300X s rychlejší a větší pamětí (až 256 GB HBM3e namísto maximálně 192 GB HBM3).
Koncem letošního roku očekáváme architekturu CDNA 4, která využije 3nm proces TSMC, navýší výpočetní výkon o minimálně 75 % (pro již podporované formáty), přičemž výkon v FP6 a FP4, které dosud neměly přímou hardwarovou podporu, vzroste zhruba 3,5×. Kapacita paměti stoupne na 288 GB a datová propustnost asi o třetinu, ale to zatím není jisté. AMD bude výslednému akcelerátoru říkat (poněkud neintuitivně) Instinct MI350X.
Roadmapa akcelerátorů Instinct (AMD)
Někdy koncem roku 2026 dojde na Instinct MI400X postavený na UDNA (dříve CDNA 5). Dozvídáme se, že podobně jako dvě předchozí architektury bude čip rozložen na 8 výpočetních čipletů, které však budou rozdělené na dvě podložky. Krom těchto 8 výpočetních čipletů mohou být nově přítomny ještě 2 multimediální čiplety (akcelerátory). Ne snad proto, aby si pracovník čekající na dokončení výpočtu mohl přehrávat seriály z Netflixu. S nejvyšší pravděpodobností jde o důsledek směřování AI, které pracuje s velkým množství obrazových a video-dat, případně pro generativní AI, kdy může být výstupem právě obrázek nebo video. Dekódování a komprimace se v těchto případech stává prvkem limitujícím výkon a samostatný čiplet, tedy volitelný multimediální akcelerátor, může v těchto případech podstatně navýšit reálný výkon řešení.