Oracle postaví AI infrastrukturu na Instinct MI300X od AMD, s Nvidií skončil
Oracle
V březnu Oracle oznámil, že uzavřel dohodu s Nvidií, od které koupí 32 768 AI GPU, na nichž postaví vlastní systém pro AI (OCI). Minulý týden došlo k propadu akcií Oraclu poté co zástupce společnosti oznámil problémy s dodávkami akcelerátorů Nvidie H100, energetickými nároky a síťovým řešením. Nyní následuje zpráva, že se Oracle rozhodl jako řešení tohoto problému upustit od „proprietárního křemíkového programu“ a namísto toho začátkem roku nasadí akcelerátory Instinct MI300X od AMD. K Nvidii se naplánuje vrátit dříve, než budou popsané problémy vyřešeny, což nebude dříve než v polovině roku 2024.
AMD Instinct MI300X (AMD)
AMD vyvinula tři řady akcelerátorů Instinct řady MI300. První byla uvedena MI300A, která spojuje procesorová jádra Zen 4, výpočetní architekturu CDNA 3 a paměti HBM3. Jejím primárním cílem byl superpočítač El Capitan. Jako druhá šla na řadu MI300X, o níž nyní hovoří Oracle. Jde o čistě akcelerační řešení (CDNA 3 + HBM3) bez procesorových jader. V laboratořích má AMD ještě MI300C, což je naopak kombinace čistě procesorových jader Zen 4 s HBM3 (tedy bez architektury CDNA 3). Není vyloučeno, že toto řešení nakonec do sériové výroby nepůjde, neboť jde o specificky zaměřený hardware, pro který není na trhu tak velký prostor, a ubíral by výrobní kapacity MI300A / MI300X.
Microsoft, Amazon a Meta
Prozatím neoficiální, ale dost dobře možný, je podobný scénář i u Microsoftu. Analytik společnosti UBS, Karl Keirstead, uvedl, že právě Microsoft (a také Amazon) se potýkají s podobnými problémem jako Oracle. U Microsoftu, který zvažoval různé alternativy, už podle neoficiálních zdrojů rovněž padlo rozhodnutí nasadit Instinct MI300X od AMD. Potenciálními kandidáty zůstávají Amazon a Meta. „Úzkou spolupráci“ společností Microsoft i Amazon s AMD rovněž zmínil analytik Ming-Chi Kuo.
IBM
Oficiální rozhodnutí padlo u IBM, která nakonec rovněž zvolila řešení od AMD, tentokrát však nikoli na bázi CDNA 3. Celá situace je o to zajímavější, že Inferenční platforma AI od IBM byla prezentována jako řešení postavené na čipu NR1 AI od společnosti NeuReality. Teprve nyní vyšlo najevo, že NeuReality ve skutečnosti svůj NR1 staví na FPGA AMD / Xilinx a jde o výsledek spolupráce NeuReality a Xilinxu ohlášeném již v roce 2021, která spočívá ve využívání architektury Xilinx Versal ACAP.