AMD Instinct MI200 / Aldebaran podporuje až 128 GB HBM2E
O výpočetním GPU Aldebaran a na něm postaveném akcelerátoru AMD Instinct MI200 již víme několik informací. V první řadě jde o produkt postavený na architektuře CDNA 2 (instrukční set GFX90A), který se bude skládat z dvojice identických čipletů. Jeden bude nastaven jako řídící. Výpočetní jednotky podporují double-precision / FP64 výpočty v plném výkonu, což je v segmentu GPGPU akcelerátorů novinka. Integrován bude videoakcelerátor VCN 2.6. Počítá se s pamětmi HBM2E.
Nyní k tomu novému. Každý z čipletů nabídne 112 CU, tedy 7168 stream-procesorů; 14336 celkem. Není však jisté, zda tato čísla odpovídají počtu jednotek fyzicky přítomných v křemíku, nebo jde o počet aktivních jednotek (z vyššího celkového počtu, např. 128 CU). To už je ale spíše detail.
Zajímavější informací je, že AMD počítá s podporou až 128 GB HBM2E. Neznamená to, že hned první vydaná verze musí být osazena takovou kapacitou, ale že AMD takovou konfiguraci testuje a v případě potřeby může vydat. Konkurenční Nvidia A100 existuje ve 40GB a 80GB verzi, takže je pravděpodobné, že AMD dříve či později bude chtít nabídnout víc a nezůstane pouze u 64GB modelu. 128GB konfigurace při 16GB na paměťový čip znamená potřebu 8 čipů. To by znamenalo čtyři HBM2E čipy na každý z obou výpočetních čipletů.
Instinct MI200 tak začíná vypadat jako poněkud těžkotonážní řešení. I kdybychom předpokládali, že oproti MI100 klesne takt z 1800 MHz na 1500 MHz, stoupne výkon v FP64 z 11,5 TFLOPS na 43 TFLOPS, což je 4,4násobek Nvidia A100. V kombinaci se 128GB kapacitou paměti lze očekávat vše, jen ne konzervativní cenovku takového akcelerátoru. Instinct MI200 měli mít vybraní partneři AMD k dispozici v podobě vzorků již v prvním kvartálu letošního roku a oficiálně bylo potvrzeno, že k vydání dojde ve druhém pololetí. Vydání může být záležitost čistě formální, neboť většina počáteční produkce patrně skončí v systému Frontier, který bude s 1,5 EFLOPS nejvýkonnějším superpočítačem světa. Instinct MI200 v něm bude nejspíš doprovázet speciální procesor Trento vycházející z architektury Zen 3. Systém bude podporovat plně koherentní UMA (Unified Memory Architecture). Zatím nevíme, zda (ne)bude Trento vybaven V-cache.