Informace o architekturách Nvidia Ampere a Hopper pocházejí z jediného zdroje
Vezměme to po pořádku. Vynecháme-li samotné označení architektury (Ampere), 7nm proces a vydání někdy v příštím roce, kolují webem informace, které hovoří o výpočetních čipech GA100 a GA101, o tom, že první má být vybaven šesti kanály osazenými pamětmi HBM2, druhý třemi. Dále, že GA101 byl snad zrušen. Také se dočteme o tom, že nejdříve budou uvedené tyto profesionální produkty, poté dojde na herní GeForce postavené na jiných čipech téže architektury. A nově se můžeme doslechnout i o tom, že nástupcem architektury Ampere bude Hopper. Generace pojmenovaná po Grace Hopper, významné osobnosti světa IT. A jako bonus, že Hopper bude de facto čipletová architektura.
Ještě než se podíváme na dílky skládačky, kterým jsme se dosud nevěnovali, stojí za upozornění jeden fakt. Ačkoli tyto informace přinášely různé weby, případně se objevovaly po různých diskuzních fórech, pátrání po původním zdroji vede u všech těchto údajů na twitterový účet uživatele kopite7kimi. Všechny úniky tedy pocházejí z jediného zdroje, což je samo o sobě zajímavé. Obvykle jich bývá více a z toho, jak se překrývají nebo překrývají lze odvozovat jejich důvěryhodnost. Právě to nás vede k podstatnému problému: kopite7kimi uvádí informace převážně dlouhodobého charakteru, které budou potvrzeny či vyvráceny až v příštím, přespříštím (atd.) roce, takže není na základě čeho hodnotit, do jaké míry jsou věrohodné.
Na jeho účtu se sice objevilo i pár zmínek o hardwaru AMD nebo řadě Nvidia RTX Super, ale v případě procesorů AMD Zen 2 se informace potvrdily pouze částečně (byť obsahovaly některé unikátní informace, které s největší pravděpodobností nemohly být prostě jen správně tipnuté). V případě GPU AMD Navi 10 se trefil počtem stream-procesorů, nikoli organizací jádra. V případě Nvidia RTX Super byla úspěšnost vyšší, na druhou stranu podobné leaky tehdy uváděly i jiné zdroje, takže nelze říct, zda kopite7kimi skutečně předložil informaci exkluzivního původu, která se z nemalé části potvrdila, nebo převzal něco, co již kolovalo internetem a trefil se. Jinými slovy, je možné, že tento člověk nějaké kvalitní zdroje v branži má, ale prozatím není způsob, jak to ověřit.
Projděme si vše, co tento zdroj zveřejnil:
Ampere
- GA100 = 8 GPC * 8 TPC * 2 SM * (64 FP32 + 32 FP64 + 16 Tensor), ??M L2
- GV100 = 6 GPC * 7 TPC * 2 SM * (64 FP32 + 32 FP64 + 8 Tensor), 6M L2
- TU102 = 6 GPC * 6 TPC * 2 SM * (64 FP32 + 8 Tensor + 1RT Core), 6M L2
Výpočetní GPU Ampere GA100, jehož struktura je popsána v prvním řádku, by neslo 8192 stream-procesorů a oproti Volta GV100 (5376 stream-procesorů) by se zdvojnásobil počet Tensor Cores v každém SM bloku. Při zohlednění vyššího počtu SM bloků by počet Tensor Cores mezi top-modelem Volty a Ampere vzrostl z 672 na 2048, tedy téměř přesně na trojnásobek.
- GA100 = 8** mm², 55 B, 6 * HBM, 2304 GB/s, 8 GPC
Ampere GA100 by měl dosahovat plochy přes 800 mm² (Volta GV100: 815 mm²), obsahovat 55 miliard tranzistorů (Volta GV100: 21 miliard) a šest kanálů HBM o propustnosti 2304 GB/s. To značí použití 3GHz HBM2 čipů, tedy tzv. HBM2E. Připomeňme, že výrobu HBM2E ohlásil Samsung (3,2GHz), Hynix (3,6GHz) a GlobalFoundries (bez upřesnění rychlosti).
- GA101 is half of GA100
Čip Ampere GA101 by měl být přesnou polovinou konfigurace Ampere GA100, což by odpovídalo ploše přes 400 mm², asi 27 miliardám tranzistorů, 3 HBM čipům připojeným 3072bit sběrnicí a maximálně 4096 stream-procesorům.
GA100/101 TSMC 7
GA102/103/104/106/107 SAMSUNG 8
Ampere Compute Series
TSMC 7 EUV
- GA100 = 8 GPC * 8 TPC * 2 SM, 6144bit
- GA101 = 4 GPC * 8 TPC * 2 SM, 3072bit
Ampere Gaming Series
SAMSUNG 8 EUV
- GA102 = 7 GPC * 6 TPC * 2 SM, 384bit, NVLINK
- GA103 = 6 GPC * 5 TPC * 2 SM, 320bit
- GA104 = 6 GPC * 4 TPC * 2 SM, 256bit
- GA106 = 3 GPC * 5 TPC * 2 SM, 192bit
- GA107 = 2 GPC * 5 TPC * 2 SM, 128bit
V první řadě na těchto údajích překvapí, že výpočetní a herní čipy nemají pouze vzniknout u odlišného výrobce (výpočetní u TSMC, herní u Samsungu), ale především, že má jít o odlišné procesy: 7nm EUV v případě výpočetních čipů od TSMC a 8nm EUV v případě herních čipů od Samsungu.
Samsung 8nm proces skutečně uvedl, nabízí tzv. 8LPP (low-power plus) a 8LPE (low-power extreme), není ovšem pravdou, že by kterýkoli z nich využíval EUV litografii. Ta přijde až se 7nm generací a Samsung výslovně zmínil, že 8nm LPE proces je alternativou pro ty zákazníky, kterým bude EUV výroba nedostupná (nejspíš cenově nebo kapacitně). 8nm proces Samsungu je ve skutečnosti derivátem 10nm výroby.
Dále se dozvídáme, že GA102 (pro hypotetickou GeForce RTX 3080 Ti a Titan) by disponovala až 5376 stream-procesory, GA103 (novinka, „trojkové“ GPU v nabídce Nvidie dosud nebylo, možná GeForce RTX 3080 Ti nebo 3080?) až 3840 stream-procesory, GA104 (GeForce RTX 3080/3070?) až 3072 stream-procesory, GA106 (GeForce RTX 3060?) 1920 stream-procesory a GA107 (GeForce RTX 3050?) 1280 stream-procesory. Šířka sběrnic zůstává ve stávajících kolejích.
Hopper
- After Ampere, the next codename of GeForce is Hopper, in memory of Grace Hopper.
Generace nastupující po Ampere by měla být nazvána Hopper po Grace Hopper, slavné programátorce a autorce programovacích jazyků. Medailonek této dámy si dovolím zkopírovat ze staršího Davidova článku:
Admirálka amerického námořnictva začala s programováním již v dobách Mark I, později s UNIVACem. Odmítla profesorské místo, aby strávila příštích 30 let na čele vývoje IT světa. Svoji ideu, že programování by mělo být tak snadné jako angličtina, dokázala přeměnit ve vznik programovacího jazyka FLOW-MATIC, z něhož později vzešel známý COBOL. Po opuštění námořnictva pracovala jako konzultantka pro firmu DEC až do své smrti v 85 letech. |
- GeForce of Hopper will use MCM module to build giant cores.
Hopper má využívat MCM (multičip moduly). Vzhledem k tomu, že ty využívá již Volta a výpočetní Ampere (GPU a HBM v jednom pouzdře), je zřejmé, že autor tím měl na mysli zcela konkrétně MCM tvořené více výpočetními / grafickými čipy, tedy nikoli (jen) jeden výpočetní / grafický čip (a k tomu paměťové čipy HBM). V takovém případě by šlo o modulární nebo čipletovou architekturu.
To by nebylo velkým překvapením, Nvidia nějaké patenty v tomto směru ve vztahu k výpočetnímu nasazení má a navíc rozvíjí sběrnici NVLINK a další systémy, které směrem k určitému typu modularity vedou. Veškeré dosavadní informaci ale hovořily o výpočetním segmentu (modularita v grafickém segmentu je obtížnější, neboť je potřeba sdílet rychle vyšší objemy dat). kopite7kimi však hovoří výslovně o „GeForce“. Lze však připustit, že si neuvědomil, že se modularita vztahuje na výpočetní čipy, nikoli grafické. Nebo Nvidia s Hopper překvapí a přinese modularitu i do herní grafiky. Závěrem ještě jedna drobnost: Informace o generaci Hopper visí na Twitteru kopite7kimi již od června.