Akcelerátor Nvidia Hopper poprvé na fotografiích
22. března zveřejnila Nvidia pouze rendery 4nm GPU GH100 / akcelerátoru H100, takže na snímky skutečného hardwaru padlo NDA až nyní. Možnost vyfotit vzorek reálný akcelerátor dostaly redakce webů ServeTheHome a CNet:
Nvidia H100, zadní strana; zdroj: ServeTheHome
Patrick J Kennedy ze ServeTheHome (jehož snímky vidíte výše) měl možnost kartu (modul) vyfotit již 7. dubna; svolení k publikaci však Nvidia dala až nyní v květnu.
zdroj: CNet
Na SXM modulu nejsou patrné žádné zvláštnosti, snad jen stojí za pozornost, že oproti Ampere došlo k pootočení GPU o 90°, takže trojice HBM pamětí z každé strany jádra je orientována „podélně“ k delší straně modulu.
AMD MI250X | AMD MI300 | Nvidia Tesla V100 | Nvidia A100 | Nvidia H100 | ||
---|---|---|---|---|---|---|
GPU | Aldebaran | Rigel | GV100 | GA100 | GH100 | |
architektura | CDNA 2 | CDNA 3 | Volta | Ampere | Hopper | |
formát | OAM | OAM | SXM2 | SXM4 | SXM5 | |
CU/SM | 220 | ? | 80 | 108 | 132 | |
FP32 jader | 14080 | ? | 5120 | 6912 | 15872 16896 | |
FP64 jader | - | - | 2560 | 3456 | 8448 | |
INT32 jader | - | - | 5120 | 6912 | 8448 | |
Tensor Cores | 880 | ? | 640 | 432 | 528 | |
takt | 1700 MHz | ? | 1530 MHz | 1410 MHz | ? | |
↓↓↓ T(FL)OPS ↓↓↓ | ||||||
FP16 | 383 | ? | 31,4 | 78 | 120 | |
BF16 | 383 | ? | 39 | 120 | ||
FP32 | 95,7 47,8 | ? | 15,7 | 19,5 | 60 | |
FP64 | 47,8 | ? | 7,8 | 9,7 | 30 | |
INT4 | 383 | ? | ? | ? | ? | |
INT8 | 383 | ? | ? | ? | ? | |
INT16 | ? | ? | ? | ? | ? | |
INT32 | ? | ? | 15,7 | 19,5 | 30 | |
FP8 tensor | ? | 2000/4000* | ||||
FP16 tensor | 383 | ? | 125 | 312/624* | 1000/2000* | |
BF16 tensor | 383 | ? | 312/624* | 1000/2000* | ||
FP32 tensor | 95,7 | ? | 19,5 | 60? | ||
TF32 tensor | ? | 156/312* | 500/1000* | |||
FP64 tensor | 95,7 | ? | 19,5 | 60 | ||
INT8 tensor | 383 | ? | 624/1248* | 2000/4000* | ||
INT4 tensor | ? | ? | 1248/2496* | ? | ||
↑↑↑ T(FL)OPS ↑↑↑ | ||||||
TMU | -? | ? | 320 | 432 | 528 | |
LLC | 16 MB | ? | 6 MB | 40 MB | 50 MB | |
sběrnice | 8192bit | ? | 4096bit | 5120bit | 5120bit | |
paměť | 128 GB | 128 GB | 32 GB / 16 GB | 40 GB | 80 GB | 80 GB |
HBM | 3,2 GHz | ? | 1,755 GHz | 2,43 GHz | 3,2 GHz | 4,8 GHz |
pam. prop. | 3277 GB/s | ? | 900 GB/s | 1555 GB/s | 2048 GB/s | 3072 GB/s |
TDP | 500 W 560 W | ? | 300 W | 400 W | 700 W | |
transistorů | 58,2 mld. | ? | 21,1 mld. | 54,2 mld. | 80 mld. | |
plocha GPU | 2× ? | 4× ? | 815 mm² | 826 mm² | 814 mm² | |
proces | 6 nm | 5nm | 12 nm | 7 nm | 4nm | |
datum | 11. 2021 | 2022? | 2017 | 5. 2020 | 11. 2020 | 2022? |
Podle informací z doby březnového představení nemá být novinka dostupná v prvním pololetí letošního roku. V Japonsku se objevila možnost předobjednávek PCIe varianty (o 20 % nižší počet funkčních bloků, HBM2E namísto HBM3) za $33 000.