Nvidia má i PCIe variantu Tesla P100, je však pomalejší
Pro klasické systémy s PCIe sloty připravuje Nvidia variantu Tesly P100 (s jádrem Pascal GP100) v formátu odpovídajícímu klasické dvouslotové kartě, jak bylo doposud v tomto segmentu zvykem. Změna konceptu s sebou ale nenese jen odlišný tvar a konektivitu, ale také určité rozdíly v parametrech. Jádro GP100 zůstává plně aktivní (což znamená přítomnost 3584 výpočetních jednotek), snížena ale byla taktovací frekvence. Zatímco stávající varianta Tesly P100 boostuje až na 1480 MHz, slotová verze je omezena na 1300 MHz. Základní takt zatím nebyl potvrzen, ale pokud by měl být zachován 11,5% odstup mezi oběma frekvencemi, šlo by o 1166 MHz.
Fermi | Kepler | Maxwell | Pascal | ||
Tesla | M2090 | K40 | M40 | P100 | |
GPU | GF110 3 mld. tr. | GK110 7,1 mld. tr. | GM200 8 mld. tr. | GP100 15,3 mld. tr. | |
Plocha | 520 mm² | 551 mm² | 601 mm² | 610 mm² | |
Proces | 40 nm TSMC | 28 nm TSMC | 28 nm TSMC | 16 nm TSMC | |
Frekvence | 650 MHz 1300 MHz | 745 MHz 810 / 875 MHz | 948 MHz 1114 MHz | 1328 MHz 1480 MHz | ? 1300 MHz |
SPs | 512 | 2880 | 3072 | 3584 | |
TMUs | 64 | 240 | 192 | 224 | |
ROPs | 48 | 48 | 96 | ? | |
výkon (FP32) | 1,33 TFLOPS | 4,29 TFLOPS | 5,82 TFLOPS 6,84 TFLOPS | 9,52 TFLOPS 10,61 TFLOPS | ? 9,32 TFLOPS |
výkon (FP64) | 0,67 TFLOPS | 1,43 TFLOPS | 0,18 TFLOPS 0,21 TFLOPS | 4,76 TFLOPS 5,30 TFLOPS | ? 4,66 TFLOPS |
paměti | 6 GB 384bit GDDR5 | 12 GB 384bit GDDR5 | 24 GB 384bit GDDR5 | 16 GB 4096bit HBM | 12-16 GB |
takt | 3,7 GHz | 6,0 GHz | 6,0 GHz | 1,4 GHz | |
dat. prop. | 178 GB/s | 288 GB/s | 288 GB/s | 720 GB/s | 540 GB/s 720 GB/s |
TDP | 250 W | 235 W | 250 W | 300 W | 250 W |
rozhraní | PCIe | PCIe | PCIe | Mez. | PCIe |
dobová cena | ~$4499? | ~$5499? | ~$4999? | neuvedeno |
Adekvátně této změně klesá o 13,8 % výpočetní výkon. Další rozdíl se týká konfigurace pamětí. Samozřejmě zůstává zachováno HBM rozhraní a nic se nemění ani na použití 1,4GHz modulů; kapacita ale může být snížena ze 16 na 12 GB. Z toho vyplývá, že ze čtyř 1024bit kanálů mohou být využity jen tři, tj. kombinace využití 3072bit sběrnice a 3 4GB HBM modulů. Datová propustnost při této konfiguraci odpovídá 540 GB/s.
Nižší taktovací frekvence, které jsou patrně důsledkem menší chladící kapacity pasivního bloku PCIe varianty, snižují TDP z 300 na 250 wattů. PCIe varianta Tesly P100 bude dostupná koncem letošního roku; cena zatím potvrzena nebyla.