Diit.cz - Novinky a informace o hardware, software a internetu

PCIe verze Nvidia A100: Parametry stejné, TDP 250W, výkon o 10-50 % nižší

Po tradiční SXM verzi výpočetní karty Nvidia A100 s jádrem Ampere GA100 přichází i verze do PCIe slotu. Základní specifikace zůstávají, s ohledem na snížené TDP však máme čekat nižší výkon v zátěži…

Po šesti týdnech od uvedení SXM verze Nvidia A100 (již bez „Tesla“) ohlásila Nvidia verzi v provedení do PCIe slotu, podobnou jako u klasických grafických karet.

Není vybavena vlastním aktivním chladičem, nese pasiv, takže je určena pro serverové skříně, kde je pořádný průvan. Rozměry chladiče omezené prostorem pro PCIe kartu vedly ke sníženému TDP, což je jediný parametrový rozdíl oproti klasické SXM verzi:

 Nvidia Tesla P100Nvidia Tesla V100Nvidia A100
GPUGP100GV100GA100
architekturaPascalVoltaAmpere
formátSXMSXM2SXM4 / PCIe
SM5680108
TPC284054
FP32 jader / SM646464
FP32 jader / GPU (celkem)358451206912
FP64 jader / SM323232
FP64 jader / GPU (celkem)179225603456
INT32 jader / SM6464
INT32 jader / GPU (celkem)51206912
Tensor Cores / SM84
Tensor Cores / GPU640432
GPU Boost Clock1480 MHz1530 MHz1410 MHz
 ↓↓↓ T(FL)OPS ↓↓↓
FP16 tensor (FP16 acc)125312/624*
FP16 tensor (FP32 acc)125312/624*
BF16 tensor (FP32 acc)312/624*
TF32 tensor
156/312*
FP64 tensor
19,5
INT8 tensor
624/1248*
INT4 tensor
1248/2496*
FP16
21,231,478
BF16
39
FP32
10.615,719,5
FP64
5.37,89,7
INT32
15,719,5
 ↑↑↑ T(FL)OPS ↑↑↑
texturovacích jednotek224320432
sběrnice4096bit HBM24096bit HBM25120bit HBM2
kapacita paměti16 GB32 GB / 16 GB40 GB
HBM1,4 GHz1,755 GHz2,43 GHz
paměť. propustnost720 GB/s900 GB/s1555 GB/s
L2 Cache4096 KB6144 KB40960 KB
Shared Memory / SM64 KB≤ 96 KB≤ 164 KB
Register File / SM256 KB256 KB256 KB
Register File / GPU (celkem)14336 KB20480 KB27648 KB
TDP300 W300 W400 / 250 W
Transistorů15,3 mld.21,1 mld.54,2 mld.
plocha GPU610 mm²815 mm²826 mm²
proces (TSMC)16 nm FinFET+12 nm FFN7 nm N7

Nvidia ponechává beze změny papírové takty a jim odpovídající teoretický výkon. S ohledem na snížení TDP ze 400 na 250 wattů ale v souvislé zátěži takty zjevně klesnou, což se odrazí na reálném výkonu: Očekávat máme pokles o 10-50 % oproti SXM verzi.

 

Nvidia očekává, že do konce léta bude vydaných 30 serverů využívajících (některou z verzí) Nvidia A100 a do konce roku přibude přinejmenším dalších 20.

Zdroje: 

Diskuse ke článku PCIe verze Nvidia A100: Parametry stejné, TDP 250W, výkon o 10-50 % nižší

Sobota, 27 Červen 2020 - 00:23 | junk mail | Tohle je problém všech technologických molochů...
Sobota, 27 Červen 2020 - 00:11 | junk mail | To vypadá jako hliníkový blok do PCIe slotu :-D
Středa, 24 Červen 2020 - 21:51 | Waffer47 | Nenazrana NVIDIA jede presne intelím stylem,...
Středa, 24 Červen 2020 - 18:39 | Mali | Koukam na preklad do anglictiny (pac je to...
Středa, 24 Červen 2020 - 18:00 | Akulacz | Tak proč ne? Mě při snížení TDP na 50% taky...
Středa, 24 Červen 2020 - 15:29 | no-X | „četl jste ten článek na computerbase, když se...
Středa, 24 Červen 2020 - 15:10 | peca | Mě osobně nněpčijde reálné snížení výkonu o 1/10...
Středa, 24 Červen 2020 - 14:59 | ptipi | četl jste ten článek na computerbase, když se...
Středa, 24 Červen 2020 - 14:46 | no-X | Nvidia dala nějaká čísla ComputerBase a ta je...
Středa, 24 Červen 2020 - 14:43 | ptipi | "Rýpu", protože to máte evidentně...

Zobrazit diskusi