Zen 6 přinese podporu AVX512_BMM, AVX512_FP16, AVX_VNNI_INT8 a další
Zen 6 oproti Zen 5 přinese podporu pro následující instrukce:
- #AVX512_BMM
- #AVX512_FP16
- #AVX_NE_CONVERT
- #AVX_IFMA
- #AVX_VNNI_INT8
Začněme u AVX512_FP16. Formát FP16 lze považovat za vlastně prvotní prvek, jehož podpora na úrovni hardwaru byla chápána jako podpora AI. Pro AI byl totiž formát FP32 zbytečně přesný a tudíž pomalý. Vzpomenout můžeme, jak stavba superpočítače Aurora čekala (to už šlo o druhý odklad), až Intel bude mít hotové akcelerátory (Xeon Phi) s podporou FP16. Nevyšlo to (protože Xeony Phi, které uměly FP16, zase nepodporovaly FP64, což byla podmínka zadavatele), a tak Intel začal vyvíjet akcelerátory Ponte Vecchio = Xe-HPC = Xeon Max Series GPU a procesory Sapphire Rapids. Těm (a dost možná právě v souvislosti s touto kauzou) dal do vínku podporu formátu FP16 na úrovni AVX512 instrukcí (AVX512_FP16). Jenže, mezi tím uběhla spousta času a ve světě AI se začal prosazovat optimalizovaný formát BF16, jehož podporu se rozhodla zahrnout AMD do architektury Zen 4 (AVX512_BF16). Přestože se formát FP16 v AI v rámci AVX512 instrukcí používá poměrně okrajově a z hlediska poptávky je pro většinu zákazníků postradatelný (viz prodeje Xeonů Sapphire Rapids oproti prodejům Epyců Zen 4 Genoa / Bergamo), vymyslel Intel plán, jak z postradatelného prvku, který ovšem jeho hardware náhodou podporuje, vytvořit konkurenční výhodu. Při stanovení požadavků instrukční sady AVX10 vzal jako základ podporované instrukční sady Sapphire Rapids, mezi nimi i AVX512_FP16, a ty ukotvil jako povinné. To znamená, že procesor, který nepodporuje AVX512_FP16, nebude mít plnou podporu AVX10. Naštěstí pro AMD trvá nástup AVX10 tak dlouho, že od vydání Zen 4 dojde již dvě další architektonické generace, během kterých zvládla AMD podporu AVX512_FP16 doplnit, takže Zen 6 bude schopný nabídnout AVX10.
Další z instrukcí, AVX_VNNI_INT8, rovněž souvisí s Intelem. Intel totiž před lety (s Xeony Cascade Lake) rozšířil AVX512 o tzv. VNNI neboli Vector Neural Network Instructions (AVX512_VNNI). Ty rovněž byly zaměřeny na AI úlohy. Protože však novější generace desktopových procesorů Intel byly vybaveny jádry typu Atom, které AVX512 neumějí a nepodporovaly by tudíž ani AVX512_VNNI, přišel Intel pro své desktopové procesory (Alder Lake počínaje) s jakousi ořezanou náhradou, nazvanou AVX_VNNI (bez 512, tedy 256bit, jak je pro původní AVX obvyklé). Naproti tomu Zen 4 od AMD podporuje plné AVX512_VNNI. Nicméně pokud se objeví software optimalizovaný pro desktopové procesory Intelu (AVX_VNNI), ovšem nepodporující (AVX512_VNNI), může být z nevýhody na straně Intelu výhoda, neboť Zen 4 AVX_VNNI nepodporoval. S jeho podporou přišel Zen 5 (viz např. Tom's Hardware) a Zen 6 ji rozšíří o formát INT8.
Za zmínku stojí ještě AVX512_BMM, což se jeví jako novinka. BMM pokrývá operace VBMACOR16x16x16 (Vector BitMatrix Accumulate OR nad maticí velikosti 16×16×16 s OR akumulací), VBMACXOR16x16x16 (Vector BitMatrix Accumulate XOR) a VBITREV (bitová reverzace). Tyto instrukce umožňují provádět operace OR / XOR (případně transformace) nad maticemi a jim podobnými bloky. Zatím pravděpodobně není známa jiný architektura, než Zen 6, která by AVX512_MBB podporovala.



















