Nvidia na ISC představila Teslu V100 s gigantickým GPU GV100
GV100 je nejen první GPU z generace Volta, ale zároveň vůbec největší GPU, které kdy vzniklo. Měří 815 mm² a skládá se z 21 miliard tranzistorů. Obsahuje 5376 stream-procesorů a 336 texturovacích jednotek. Je ovšem podstatné dodat, že jde o parametry jádra. V případě konkrétních produktů, Tesla V100, se budou tyto hodnoty mírně lišit, protože několik bloků jádra zůstane v případě této Tesly vypnutých.
Fermi | Kepler | Maxwell | Pascal | Volta | |
---|---|---|---|---|---|
Tesla | M2090 | K40 | M40 | P100 | V100 |
GPU | GF110 3 mld. tr. | GK110 7,1 mld. tr. | GM200 8 mld. tr. | GP100 15,3 mld. tr. | GV100 21 mld. tr. |
Plocha | 520 mm² | 551 mm² | 601 mm² | 610 mm² | 815 mm² |
Proces | 40 nm TSMC | 28 nm TSMC | 28 nm TSMC | 16 nm TSMC | 12 nm TSMC |
Frekvence | 650 MHz 1300 MHz | 745 MHz 810 / 875 MHz | 948 MHz 1114 MHz | 1328 MHz 1480 MHz | ~1370 MHz 1455 MHz |
SPs | 512 | 2880 | 3072 | 3584 | 5120 |
TMUs | 64 | 240 | 192 | 224 | 320 |
ROPs | 48 | 48 | 96 | ? | ? |
výkon (FP16) | - | - | - | 19,0 TFLOPS | 28,1 TFLOPS |
výkon (FP32) | 1,33 TFLOPS | 4,29 TFLOPS | 5,82 TFLOPS | 9,5 TFLOPS | 14,0 TFLOPS |
výkon (FP64) | 0,67 TFLOPS | 1,43 TFLOPS | 0,18 TFLOPS | 4,8 TFLOPS | 7,0 TFLOPS |
paměti | 6 GB 384bit GDDR5 | 12 GB 384bit GDDR5 | 24 GB 384bit GDDR5 | 16 GB 4096bit HBM(2) | 16 GB |
takt | 3,7 GHz | 6,0 GHz | 6,0 GHz | 1,4 GHz | 1,75 GHz |
dat. prop. | 178 GB/s | 288 GB/s | 288 GB/s | 720 GB/s | 900 GB/s |
TDP | 250 W | 235 W | 250 W | 300 W | 300 W |
dobová cena | ~$4499? | ~$5499? | ~$4999? | neuvedeno | neuvedeno |
K dispozici proto bude 5120 stream-procesorů a 320 texturovacích jednotek. Pokud jde o stream-procesory, řeč je o tradičních FP32 výpočetních jednotkách. Krom nich je totiž jádro vybaveno 2560 FP64 stream-procesory, 5120 Int32 stream-procesory a 64 tensor-cores pro násobení / sčítání matic.
Tesla V100 bude vyráběná ve dvou provedeních. Jednak jako klasická PCIe karta a jednak jako SXM2 modul. Provedení se budou krom zmíněného rozhraní lišit i segmentem (PCIe verze je určena primárně pro datová centra) a také výkonem. Zatímco boost SXM2 dosahuje 1455 MHz, boost PCIe modelu odpovídá zhruba 1370 MHz.
Množství aktivních funkčních bloků je u obou karet totožné, stejně tak i kapacita paměti (16 GB), šířka sběrnice (4096bit) i takt HBM 1,75 GHz. PCIe verzi díky nižším taktům postačí 250W TDP. Oba modely budou dostupné k neupřesněnému datu druhé poloviny letošního roku.