Výpočetní výkon Tesly V100 / Volta GV100 je vysoký, posun připomíná G80
Databáze výpočetního benchmarku GeekBench se začala plnit výsledky výpočetního GPU Nvidia Volta GV100, respektive provedení Tesla V100 ze systému DGX-1. Tyto výsledky působí velmi impozantně, protože při srovnání s předchozí generací - Pascal GP100 - dosahují v průměru více než dvojnásobku. Nejde o rozdíl v jediném testu, výrazný náskok Volta drží vcelku stabilně ve všech dílčích výsledcích.
Pascal GP100 | Volta GV100 | srovnání (GP100 ~ 100 %) | |
CUDA Score | 320031 | 743537 | 232,3 % |
Sobel | 528482 23.3 Gpixels/sec | 1382119 60.9 Gpixels/sec | 261,5 % |
Histogram Equalization | 455379 14.2 Gpixels/sec | 996475 31.1 Gpixels/sec | 218,8 % |
SFFT | 66489 165.7 Gflops | 101670 253.5 Gflops | 152,9 % |
Gaussian Blur | 538403 9.43 Gpixels/sec | 1897300 33.2 Gpixels/sec | 352,4 % |
Face Detection | 49263 14.4 Msubwindows/sec | 108700 31.7 Msubwindows/sec | 220,7 % |
RAW | 1139825 11.0 Gpixels/sec | 2743361 26.6 Gpixels/sec | 240,7 % |
Depth of Field | 571644 1.66 Gpixels/sec | 1499040 4.35 Gpixels/sec | 262,2 % |
Particle Physics | 397917 62904.7 FPS | 786603 124350.1 FPS | 197,7 % |
Výsledky jsou natolik dobré, že má člověk tendenci hledat nějakou nesrovnalost, která by situaci vysvětlila. Nabízí se kupříkladu teorie, že v systému s Voltou bylo více čipů než v systému s Pascalem - jenže GeekBench běží vždy pouze na jednom GPU (a alespoň nic nenasvědčuje tomu, že by se tato vlastnost testu nečekaně změnila). Dále se může nabízet otázka, zda nedošlo k využití Tensor Cores, ale ani ta GeekBench nevyužívá. Alespoň ne přímo (zda je na úrovni čipu hardware použitý v rámci Tensor Cores nějakým způsobem využitelný i mimo tyto specifické operace, není známo). Velmi pravděpodobně ale může mít vliv, že Pascal GP100 byl testovaný pod CUDA 8, kdežto Volta GV100 pod CUDA 9, která přináší různá vylepšení.
Faktem zkrátka zůstává, že byť je Volta GV100 „jen“ o třetinu větší (co do plochy) či jen o 37 % větší (co do počtu tranzistorů) než Pascal GP100, dosahuje přinejmenším v testu GeekBench o 138 % vyššího výkonu.