Diit.cz - Novinky a informace o hardware, software a internetu

Jen-Hsun Huang předvedl Rubin, Rubin Ultra i Rubin CPX včetně plánů 2026-2027

Zdroj: Nvidia

Na GTC Washington 2025 vystoupil CEO společnosti Nvidia a ukázal hardware ohlášený na jaře letošního roku. Architektura Rubin se očekává v roce 2026, v roce 2027 bude následovat Rubin Ultra…

Nástupcem současných akcelerátorů z rodiny Blackwell bude rodina Rubin. Stejně jako v případě současné generace počítá Nvidia s moduly integrujícími její vlastní ARM CPU, pouze se z generace Grace přejde na generaci Vera.

Rubin (NVL144)

Modul, který byl vidět v rukou Jen-Hsun Huanga, tvoří dvě GPU Rubin (každé tvořené dvěma kusy křemíku o rozměrem blízkým maximální /reticle limit/ monolitické ploše, kterou zvládají vyrobit procesy TSMC) osazené 288 GB HBM4 paměti na čip (pouzdro), tedy 576 GB na modul. Dále nese modul zmíněný proces Vera (88 ARM jader, 176 vláken, s GPU propojený přes NVLINK-C2C s propustností 1,8 TB/s). V rámci systému NVL144 bude podle Nvidie dosahováno výkonu 3,6 EFLOPS FP4 pro inferenci a 1,2 EFLOPS FP8 pro tréning, což je zhruba 3,3× vyšší výkon než u současné GB300 NVL72 platformy. Masová výroba má být zahájena začátkem roku 2026, později ve stejném roce bude hardware dostupný. To je určitý rozdíl oproti původně avizovaným plánům v roce 2024, kdy se očekávalo zahájení masové výroby již koncem roku 2025.

Vera Rubin (Nvidia)

Huang představil i podobu systému s tzv. Rubin CPX. O tom jsme vás informovali již v září, ale raději si připomeňme, oč jde. Rubin CPX jsou moduly, výpočetním výkonem podobné standardní Rubin, ale namísto HBM osazené levnějšími GDDR7. Nvidia poukazuje na to, že inference (použití natrénovaného AI modelu) se skládá ze dvou hardwarově náročných fází. Tzv. prefil phase je náročná na výpočetní výkon, ale nenáročná na datovou propustnost a decode phase je naopak nenáročná na výpočetní výkon, ale náročná na datovou propustnost. Nvidia tak chce prefil phase přesunout na moduly Rubin CPX a na plnohodnotném Rubin s HBM realizovat pouze decode phase. To sice samo o sobě (při stejném počtu GPU) nijak významně nezvýší výkon, ale mohlo by to snížit výrobní náklady části modulů (o rozdíl ceny mezi HBM a GDDR7).

Vera Rubin (Nvidia)

Nvidia plánuje (jak vidíte výše) nabídnout konfiguraci, která ke každému modulu Vera Rubin (tzn. dvě GPU, respektive čtyři kousky křemíku Rubin) osazovat čtyři kousky křemíku Rubin CPX, tedy v poměru 1:1.

Rubin Ultra (NVL576)

Nvidia se netají ani dalekými výhledy a mluvila i o Rubin Ultra, což je (podobně jako Blackwell Ultra) stejná architektura jako verze bez Ultra, ale ve vydatnější konfiguraci. Čip v tomto případě není tvořen dvěma křemíky (~reticle limit), ale rovnou čtyřmi. V kombinaci s (téměř) zdvojnásobením kapacity paměti na každý křemík to znamená 1TB kapacitu HBM4 na čip (pouzdro). Celý systém tak nabídne 15 EFLOPS FP4 and 5 EFLOPS FP8. Dostupnost se očekává ve druhém pololetí roku 2027.

AI rodamapa do roku 2028 (Nvidia)

Koncem roku 2027 nebo začátkem roku 2028 bude následovat nová architektura Feynman, párovaná opět s CPU Vera.

Diskuse ke článku Jen-Hsun Huang předvedl Rubin, Rubin Ultra i Rubin CPX včetně plánů 2026-2027

Žádné komentáře.