Prognózy podcenily zájem o procesory, Agentic AI rychlé akcelerátory nepotřebuje
Agentic AI, neboli agentní AI, spočívá v nasazení autonomní AI, která funguje samostatně, bez potřeby příkazů k jednotlivým úkonům. Na základě vstupních data sama reaguje, zpracovává, plánuje, rozhoduje a podobně. Jde o podmnožinu inferenční AI, takže standardně nepotřebuje hardware výkonný v tréningu neurálních sítí. V praxi stačí inferenční akcelerátory, často i poměrně „slabé“ a velmi často je dostačující i výkon serverových procesorů. Tím jde o prvek cenově dostupný pro mnohem širší skupinu zákazníků (jsme cenově o řád až dva pod systémy s výkonnými GPGPU AI akcelerátory Nvidie), což umožňuje širokou adopci.
Prognózy, které v loňském roce sestavovaly výhledy na rok 2026, tohle nejspíš poněkud podcenily. Nepoukazují na to jen samotní výrobci procesorů (AMD, ARM a Intel), ale tento stav nyní potvrdila i japonská společnost IBIDEN, která dodává substráty (včetně PCB). Ve své prezentaci porovnala rozložení poptávky podle prognózy na rok 2026 a reálný vývoj podle objednávek.
Původní prognóza z loňského října (vlevo) oproti současnému předpokladu na základě reálného vývoje (vpravo)
(IBIDEN)
Z grafu vyplývá, že IBIDEN eviduje o téměř 27 % vyšší odběry substrátů pro klasické servery, než vyplývalo z prognózy na rok 2026. V segmentu PC a AI serverů reálná poptávka zhruba odpovídá prognózám (je jen nepatrně nižší). Pro úplnost můžeme zmínit rovněž podstatně vyšší poptávku po spínacích integrovaných obvodech.
Pro výrobce procesorů jde o dobrou zprávu, jejich produkty AI akcelerátory nevytlačují, naopak působí synergicky a modely, které na nich byly natrénované, nyní budou provozované na procesorech. Situaci může využít především ARM, které se s CPU AGI podařilo vystihnout dobu sílící poptávky. Dále se očekává rostoucí zájem o procesory AMD Epyc. Tam již leccos naznačily vývoj tržního podílu v prvním kvartálu.
Další potenciál skýtá nová generace hardwaru, Epycy postavené na jádru Zen 6 (Venice), které budou vydané koncem tohoto roku. Nepřinesou pouze obligátní nárůst IPC (očekává se kolem 12 %), ale navýší počet jader na socket ze 192 na 256 (vláken ze 384 na 512) a dále rozšíří podporu datových formátů (Int8, FP16) a instrukcí (AVX512_BMM, AVX512_FP16, AVX_VNNI_INT8, AVX_NE_CONVERT a AVX_IFMA), které posouvají podporu pro AI úlohy vysoko nad rámec Zen 5. Epyc Venice se v tomto ohledu posune také nad úroveň stávající serverové nabídky Intelu a to nejen co do zvýšení náskoku v počtu jader a v podpoře nových instrukcí (AVX512_BMM), ale také v zavedení architektury FRED (Flexible Return and Event Delivery), která modernizuje model x86 přerušení a jíž Intel letos podporuje pouze na mobilním Panther Lake.
| AVX512_BMM (Bit Matrix Multiply) je rozšíření AVX-512, které zavádí specializované instrukce pro rychlé násobení binárních (bitových) matic. Místo klasických čísel počítá s maticemi, kde každý prvek je vyjádřen jen 0 nebo 1, což CPU umožňuje tyto operace provádět extrémně efektivně (nativní formát). Díky AVX-512_BMM může CPU dosahovat výrazně nižších latencí a zároveň i spotřeby než s FP16/INT8 výpočty. Hodí se pro binární neurální sítě, zjednodušené transformery, komprimované modely a lze s jeho využitím optimalizovat některé LLM inference. |
U Intelu je situace prostší. Podle neoficiálních zdrojů je letošní vydání, respektive reálná dostupnost, Xeonů nové generace (Diamond Rapids) pasé. Prodeje nemají nastat dříve než v pololetí 2027, takže letošní situaci na trhu procesorů neovlivní.
Intel tedy bude do konce letošního (a nejspíš až do poloviny příštího) roku v defenzivě s maximálně 128jádrovými Xeony Granite Rapids postavenými na bázi velkých jader z Meteor Lake. Více jader (snad až 288) sice nabídne atomový Sierra Forest, ale ten nepodporuje HT ani AVX-512, takže z hlediska serverových AI zátěží nejde o optimální řešení. Očekává se, že v absolutních číslech prodeje Xeonů stoupnou, ale porostou citelně pomaleji než poptávka, takže podíl na trhu bude oproti AMD i ARM nadále klesat.
Prakticky žádné zdroje, které rozebírají nárůst poptávky po serverových procesorech (Agentic AI / Cloud), nezmiňují dopady na Nvidii. Pravděpodobným důvodem bude, že její procesory (např. Grace) v samostatné podobě z hlediska trhu prakticky neexistují a jejich zastoupení je důsledkem párování s AI akcelerátory, na které jsou pájeny. Jelikože je v tomto kontextu řeč převážně o systémech bez akcelerátorů, nebude mít tento nečekaný výkyv na prodeje procesorů Nvidie významnější vliv.
IBIDEN aj.





















