Diit.cz - Novinky a informace o hardware, software a internetu

Slajdy o Radeon Instinct MI100 potvrzují ~8k stream procesorů, 32 GB a 34 TFLOPS

Radeon Instinct MI100 s GPU Arcturus má být dostupný ještě letos. Vypadá to, že celé systémy osazené čtveřicí GPU a dvojicí procesorů Epyc Milan / Zen 3 budou v prodeji krátce před Vánoci…

GPU Arcturus a na něm postavený Radeon Instinct MI100 budou prvním produktem vzniklým na bázi architektury, kterou AMD označuje jako CDNA. Ta je výpočetním protipólem graficky zaměřené RDNA. Oba vznikly rozdělením vývoje univerzální architektury GCN na architekturu specializovanou pro výpočty a pro grafiku. CDNA je alespoň konfigurací a řízením výpočetních jednotek o něco blíže GCN než RDNA, lze ji vnímat jako evoluci generace Vega (byť patrně s více než jen dosud známými změnami).

Únikem BIOSu a kódu pro Radeon Instinct MI100 jsme se již v prním kvartálu dozěděli, že jádro Arcturus nese 8192 stream-procesorů, existuje vzorek se 7680 aktivními a dále, že využívá HBM2 paměti o kapacitě 32 GB. Tyto informace potvrzuje (a další přináší) soubor slajdů, které zveřejnil YouTube kanál AdoredTV. Což je docela zajímavé, protože až dosud tento „zdroj“ zveřejňoval - řekněme - spekulace, které se spíše nepotvrzovaly. Tentokrát kupodivu předložil něco hmatatelného, co se navíc nejeví zcela nesmyslně:

Na slajdu vidíme způsob propojení čtyř GPU Arcturus / Radeon Instinct MI100 s dvojicí procesorů Epyc Milan (Zen 3) nebo Epyc Rome (Zen 2). To si zákazník vybere podle vlastní libovůle. Zatímco GPU komunikují s procesory přes PCIe 4.0, procesory vzájemně propojuje Infinity Fabric (po novu: Infinity Architecture). Radeon Instinct MI100 dosahuje FP32 výkonu 34 TFLOPS a je vybaven 32 GB HBM2 paměti o datové propustnosti 1,2 TB/s, čemuž odpovídá kombinace 4096bit sběrnice (čtyři čipy HBM2) a 2,4 GHz efektivního taktu. Pokud dobře chápu dataci, bude systém vybavený Epycy (dle výběru) a MI100 dostupný 20. prosince a verze s Xeonem (že by již Ice Lake?) 21. února.

Ke grafům: Dozvídáme se, že TDP 34TFLOPS Radeonu Instinct MI100 bude 300 wattů (modrý sloupec), tedy stejné jako u Nvidia A100 / Ampere GA100. V grafu je uveden také odpovídající oficiální FP32 výkon Nvidia Tesla V100S / Volta GV100, který činí kolem 15 TFLOPS (bílý sloupec). Trochu zarážející je šedý sloupec s hodnotami pro Nvidia A100. Oficiální specifikace uvádějí zhruba 20 TFLOPS pro standardní FP32, jenže graf AMD uvádí zhruba 30 TFLOPS. Spletl se někdo v AMD při malování grafu? Pokud se podíváte na specifikace Nvidia A100, zjistíte, že tento čip v žádné přesnosti nedosahuje výkonu kolem 30 TFLOPS, takže nemohlo jít ani o záměnu hodnot při kopírování.

Nvidia má stále na webových stránkách údaj „Peak FP32 19.5 TF“ a jiný ani nedává dobrý smysl, takže nezbývá jiné vysvětlení, než že AMD ve srovnání výkon konkurence omylem o 50 % nadsadila. Napadá-li vás lepší vysvětlení, můžete se samozřejmě podělit v diskuzi.

Vrátíme-li se k samotné hodnotě 34 TFLOPS, může jí být dosaženo při aktivních (všech) 8192 stream-procesorech běžících na zhruba 2050 MHz, nebo na 7680 stream-procesorech běžících kolem 2200 MHz.

Další slajd popisuje pokročilejší konfiguraci, která ke dvojici Epyců připojuje 2× 4 Radeony Instinct MI100, které tentokrát nespojuje jen PCIe 4.0 sběrnice vedená přes Epyc, ale také vzájemně (přímo) Infinity Fabric. Díky tomu dochází k téměř lineárnímu škálování výpočetního výkonu. Tyto systémy mají být dostupné 21. března.

Z třetího slajdu je část odmazaná, takže nám mnoho nesděluje. Zmínka je podpoře Tensor OPS, ale na jaké úrovni, to se nedozvídáme. Radeon Instinct MI100 každopádně vypadá na řešení zaměřené primárně na FP32 výkon a standardní (míněno netenzorové) operace, ve kterých má překonat Nvidia Ampere GA100. Na slajdu možná překvapí trochu zvláštní volba fontů.

Čtvrý slajd - není jasné, zda pochází od AMD nebo nějaké partnerské firmy - srovnává mj. poměr cena / výkon při FP32 mezi Radeon Instinct MI100 a Nvidia A100. Dále uvádí, že Radeon dosahuje nejvyššího výkonu v FP32, ale Nvidia A100 zůstává FP64, FP16 a Tensor. Výkonnostní pozice v tenzorových operacích je pochopitelná, ale těžko říct, jak je možné, že při výkonu v FP32 není pozice v FP16 a FP64 rovněž nejvyšší. Nvidia A100 má výkon FP64:FP32:FP16 škálovaný standardně poměrem 1:2:4, což platí i pro stávající Radeon Instinct MI50 (Vega 20) a jeho předchůdce. Aby Radeon Instinct MI100 dosahoval méně než polovičního FP64 výkonu oproti FP32 a méně než dvojnásobného FP16 výkonu oproti FP32, muselo by dojít na nějaké hardwarové omezení i ve srovnání s předchozí generací.

Slajdy nám tedy leccos potvrzují, leccos odhalují (datum dostupnosti systémů s těmito kartami, konfiguraci pamětí, propojení GPU v systémech atd.), ale krom odpovědí přinášejí i nové otazníky.


Ve článku vynecháváme shrnutí, která vytvořila AdoredTV na zákaldě těchto slajdů. Obsahují z valné části chybně opsané hodnoty, nesmyslná tvrzení a neopodstatné závěry, takže se jejich informační hodnota pohybuje v záporném rozsahu.

Zdroje: 

Diskuse ke článku Slajdy o Radeon Instinct MI100 potvrzují ~8k stream procesorů, 32 GB a 34 TFLOPS

Pondělí, 3 Srpen 2020 - 08:51 | kypec | Tie dátumy dostupnosti sú podľa mňa uvádzané v...
Pátek, 31 Červenec 2020 - 10:06 | franzzz | > Dosť vela uživatelov vlasni ešte GTX1xxx a...
Pátek, 31 Červenec 2020 - 09:32 | Peter Fodrek | To je otázka.. Retail bude mať produkty 30 dní...
Pátek, 31 Červenec 2020 - 09:23 | no-X | Nvidia dává hardware na recenze víc než měsíc...
Pátek, 31 Červenec 2020 - 08:46 | snajprik | Dufam že ten termin uvedenia novych AMD CPU a GPU...

Zobrazit diskusi