Nvidia vydá nové AI akcelerátory pro Čínu, top model je ~7× pomalejší než H100
Nový zákaz vývozu AI akcelerátorů do 46 zemí světa (včetně a především Číny), který zpřísňuje klíčové parametry, začal platit v říjnu. Nvidia již zareagovala a modely původně určené pro Čínu s mírnými úpravami přesměrovala na západní trhy.
- USA zpřísnily ban: Zákaz vývozu AI akcelerátorů do 46 zemí platí ihned
- Nvidia přesměrovala akcelerátory vyvinuté pro Čínu na západní trhy
Překvapivější však je, že Nvidia o čínský trh nechce přijít a připravuje trojici nových modelů, které budou splňovat požadavky definované americkými sankcemi. Jeden (HGX H20) je postaven na GPU Hopper GH100 (jako předchozí řada), dva (L20 PCIe, L2 PCIe) na Lovelace. V prvním případě AD102 (známý z GeForce RTX 4090), druhý zůstává nejasný, s ohledem na kapacitu paměti a datovou propustnost snad AD104 (známý z GeForce RTX 4070).
Jak ukazují parametry, HGX H20 dosahuje 296 TFLOPS v INT8 či FP8, což je oproti 2000 (v případě první verze Nvidia H100) téměř 7× nižší výkon. To platí plus mínus pro všechny tenzorové hodnoty. Nedošlo však jen na omezení. Kapacita L2 cache stoupla z 50 na 60 MB, datová propustnost HBM stoupla z 3 na 4 TB/s a podle Semianalysis jsou aktivní inovace, Nvidií původně chystané až pro další generaci, které umožní H20 o více než 20 % rychlejší zpracování LLM inferenčních úloh (oproti H100).
Vylepšení přinášející desítky procent výkonu však nemohou vykompenzovat snížení výkonu v násobcích. Otázkou samozřejmě zůstává, za jakou cenu bude Nvidia tato řešení nabízet a jaký o ně reálně bude zájem. Pro výrobce to může znamenat velký prostor pro vymetení skladů od čipů výrazně zasažených defekty, na druhou stranu Čína už má prakticky hotovou vlastní alternativu. Huawei minulý týden představila akcelerátor Ascend 910B, který má podle slov výrobce výkon v rozmezí původní Nvidia A100 a H100. I kdybychom předpokládali, že reálně bude spíše plus mínus na úrovni A100, půjde stále o produkt násobně rychlejší než na ~15 % původního výkonu ořezaná Hopper od Nvidie.