AMD: Už je poptávka po strojích s milionem AI akcelerátorů za desítky miliard $
Redakce webu The Next Platform požádala o rozhovor Forresta Norroda, který má na starost serverovou divizi AMD. Z celého rozhovoru, který je poměrně rozsáhlý, stojí za vypíchnutí dvě skutečnosti. První lze odbýt stručně: „[TSMC] je úžasným partnerem, úžasným výkonným strojem a my budeme i nadále používat jejich nejpokročilejší procesy v každé generaci.“
Norrod zde v podstatě potvrzuje, co se očekává s generací Zen 6 i dalšími, tedy že AMD pro část portfolia využije nejnovější dostupný proces TSMC podobně jako se Zen 5 (serverové procesory Turin-dense s až 192 jádry budou vznikat na 3nm linkách TSMC a očekává se, že jejich nástupce s jádry Zen 6 bude vyráběn na 2nm procesu TSMC zatímco zbytek portfolia přejde na 3nm proces).
(TSMC)
Zajímavější a podstatně překvapivější vyjádření souvisí se superpočítači a segmentem AI akcelerátorů. Pokud vám totiž připadá, že to, co se aktuálně kolem AI děje, je šílenství a megalománie, vězte, že jde o slabý odvar toho, na co se některé firmy chystají.
The Next Platform: Jaký je největší tréningový cluster pro AI, o kterém nějaký subjekt aktuálně uvažuje – nemusíte jmenovat. Přišel za Vámi někdo a řekl: 'Pokud jde o MI500, potřebuji 1,2 milionu GPU', nebo cokoli jiného?
Forrest Norrod (AMD): Myslíte, zda je to v tomto rozsahu? Ano.
The Next Platform: Nemůžete jen říct „je to v tomto rozsahu“. Jaké je největší skutečné číslo?
Forrest Norrod: Myslím to smrtelně vážně, je to na této úrovni.
The Next Platform: Pro jeden stroj?
Forrest Norrod: Ano, mluvím o jednom stroji.
The Next Platform: To mi trochu to vrtá hlavou…
Forrest Norrod: Tomu rozumím. Rozsah toho, o čem se nyní uvažuje, je ohromující. Ale zda se to všechno uskuteční, nevím. Existují však veřejně dostupné zprávy o tom, že velmi racionální lidé uvažují o utrácení desítek miliard dolarů nebo dokonce stovek miliard dolarů na systémy pro AI tréning.
Předně je potřeba říct, že v současnosti existují všeho všudy tři subjekty, které mají technologie na výrobu špičkových AI akcelerátorů. Jsou to TSMC, Intel a Samsung. Aktuálně je jednoznačně preferovaným výrobcem TSMC, neboť nabízí nejlepší procesy a zároveň je nejspolehlivějším partnerem (ve smyslu časového a kvalitativního dodržení plánů s novými procesy).
Všechny tři subjekty nyní rozšiřují výrobní kapacity a to ve skutečně velkém rozsahu - stále však mluvíme o nárůstu v řádu jednociferných násobků ročně (přinejlepším). Pokud tedy při stávajících kapacitách (které jsou v případě TSMC a jejího 3nm procesu téměř zcela vyčerpané až do konce roku 2026) vznikají systémy nanejvýš s desítkami tisíc akcelerátorů, pak se posun o téměř dva řády jeví jako běh na dost dlouhou trať. Je však možné, že nové procesory budou natolik drahé, že na druhé straně ubude tradičních zákazníků ze segmentu ARM SoC pro chytré telefony. Prostor pro výrobu AI akcelerátorů proto nemusí být definován pouze nárůstem výrobních kapacit nových procesů, ale i změnou v poměru výrobců, kteří tyto nové procesy budou využívat.
(Shutterstock)
Možná ještě zajímavějším oříškem bude napájení a chlazení takového systému. I kdybychom počítali s pouhými 500 watty na akcelerátor, dostáváme se na spotřebu 600 MW jen pro akcelerátory (procesory, úložiště, chlazení ap. započteny nejsou). 500 wattů je stále hodně konzervativní odhad s ohledem na to, že nadcházející generace akcelerátorů navýší spotřebu na cca 1000-1200 wattů. I oněch 600 MW zhruba odpovídá maximálnímu výkonu nejvýkonnější vodní elektrárny v České republice (přečerpávací elektrárna Dlouhé stráně). Celý systém by tak přinejmenším zblajznul plnou kapacitu některé z největších tepelných elektráren v ČR jako je například Prunéřov II nebo Počerady I s cca gigawattovým výkonem. Kde takový systém může vzniknout, proto bude značně omezeno energetickými možnostmi a rezervami dané země. Kupříkladu v Německu, které odstavilo jaderné elektrárny a spoléhá se na nespolehlivé soláry a větrníky, to asi nebude.