Diit.cz - Novinky a informace o hardware, software a internetu

Výpočetní Volta odhalen, jde o největší GPU v historii dosahující 815 mm²

Nvidia k příležitosti GTC odhalila výpočetní verzi architektury Volta v provedení největšího čipu GV100. Jde o dosud největší GPU - i přes 12nm proces dosahuje 815 mm² a nese 21 miliard tranzistorů…
Nvidia Volta Gv 100

Prezentace „velkého Volta“ byla patrně vůbec tou nejpompéznější, jakou dosud Nvidia připravila. Jen-Hsun Huang měl v zásobě řadu velkých čísel, kterými postupně šokoval přítomné publikum i diváky přímého přenosu. Jádro GV100 není velké, je obrovské. Jeho schéma vidíte níže:

Volta Gv 100 Diagram

Celý projekt vyšel Nvidii na tři miliardy dolarů a jeho výsledkem je jádro GV100 s celkem 5376 stream-procesory. Rovnou si můžeme říct, že chystané produkty ponesou 5120 aktivních (256 bude vypnuto). Jednotlivé výpočetní bloky byly přeskupeny a stejně tak došlo k podpoře nových instrukcí - vše s jediným cílem: umělou inteligencí. Jádro dosahuje plochy 815 mm², což je nejen největší plocha, jaké kdy GPU dosáhlo, ale zároveň jde o aktuální limit ze strany TSMC.

Přes závratná čísla se neposunul hrubý výpočetní výkon výrazněji než u předešlých generací. Nyní dosahuje 15 TFLOPS v FP32 a 7,5 TFLOPS v FP64. Důvodem je na poměry 12nm výrobního procesu (jde o dosud neznámou variantu 12nm FFN od TSMC) konzervativní taktovací frekvence 1455 MHz, která je nižší než u 16nm předchůdce. Možná ale ještě větší díl má na zodpovědnost fakt, že namísto zvyšování počtu stream-procesorů nebo jejich taktů došlo k doplnění nových výpočetních jednotek, které nyní podporují nový efektivnější způsob násobení matic, jimž Nvidia říká Tensor Core.

Jde o prvek zaměřený čistě na umělou inteligenci, takže je pravděpodobné, že na desktopových čipech architektury Volta nebude vůbec přítomný. Ve specifických případech ale velmi výrazně ovlivňuje výkon strojového učení. Podle tvrzení Nvidie umožňuje v těchto situacích provést výpočty, které na Maxwellu trvaly minuty, v řádu sekund (to je ovšem dáno částečně i tím, že výpočetní Maxwell nepodporoval rychlé FP16). Oproti Pascalu může jít za určitých okolností o posun až na úroveň čtyřnásobku.

Pokud jde o výrobní proces, zvolila Nvidia 12nm FFN od TSMC. Ta doposud ohlásila pouze 12nm FFC, který má být méně energeticky náročnou alternativou k 16nm výrobě. Není zatím jasné, čím se bude lišit verze FFN, ale lze předpokládat, že hlavní rozdíl bude i zde spočívat ve snížené spotřebě. Samotná frekvence jádra GV100 totiž oproti GP100 nestoupla (mírně klesla ze 1480 na 1455 MHz) a denzita stoupla spíše kosmeticky, o 4,8 % (na 25,77 milionu tranzistorů / mm² z 24,59 milionu tranzistorů / mm²). Denzita 12nm FFN procesu TSMC se zdá být velmi blízká 14nm procesům Samsungu / GlobalFoundries, přičemž energetické nároky při vysokých taktech patrně budou nižší a dosažitelné takty vyšší (to už se ale týká vysloveně procesu, nikoli jádra GV100).

Velkou otázkou bylo, zda Nvidia s Voltou nasadí paměti HMC, jak se před odkladem generace Volta a její náhradou generací Pascal s HBM předpokládalo, nebo Nvidia zůstane u HBM, které se jí osvědčily u Pascalu. HMC zmizely ze scény, došlo na HBM. Zůstala 4096bit sběrnice, ale datová propustnost vzrostla na ~900 GB/s, což indikuje použití 2GHz čipů podtaktovaných na zhruba 1,75 GHz. Celková kapacita: 16 GB.

Konkrétním produktem postaveným na GPU Volta GV100 bude Tesla V100. Ta ale nebude dostupná samostatně, Nvidia ji ohlásila jako součást systému DGX-1V, v němž bude přítomno osm Tesel. Cena za systém: $149 000. Předobjednávky jsou přijímané okamžitě. Systémy budou k dispozici v průběhu třetího kvartálu, samotné karty začne Nvidia dodávat OEM partnerům v průběhu čtvrtého kvartálu.

Menší a cenově dostupnější variantou bude DGX Station se čtyřmi Teslami, vodním chlazením a cenou $69 000. Tento systém je určený hlavně pro vývoj, cílí na inženýry zaměřené na strojové učení. Z cen produktů lze odvodit, že cena jedné Tesly se může pohybovat kolem $15 000 (asi 400 tisíc Kč).

Třetím produktem je Tesla V100 pro PCIe / Hyperscale Inference. Jde o kartu s PCIe ×16 konektorem a 150W TDP, která dosahuje plné výšky, ale poloviční délky.


Přestože toho Nvidia řekla hodně o výpočetní verzi architektury Volta, nedozvídáme se nic o desktopové (herní / grafické) verzi. Na základě rozdílů vyplývajících z možností procesu by se dalo usuzovat, že přes 12nm výrobu budou jádra výrazně větší než u generace Pascal a taktovací frekvence zřejmě tentokrát nijak enormně nestoupnou. Hlavní devizou procesu patrně bude udržení spotřeby na nižších hodnotách přes vyšší počet funkčních jednotek a změny v architektuře.

Tagy: 
Zdroje: 

Diskuse ke článku Výpočetní Volta odhalen, jde o největší GPU v historii dosahující 815 mm²

Sobota, 13 Květen 2017 - 04:35 | majster | Ak ma Vega rovnake speficikacie ako FuryX a o 47...
Pátek, 12 Květen 2017 - 11:37 | mike | Tak až budeš bouchat šampáňo za Vegu, nezapomeň,...
Pátek, 12 Květen 2017 - 10:19 | Marek Moravčík | Podľa niektorých miestnych špecialistiov dokonca...
Pátek, 12 Květen 2017 - 10:16 | Much Doge | i7 je poněkud široký pojem, třeba i7-620M určitě...
Pátek, 12 Květen 2017 - 09:25 | Sinuhet | To je česká specialitka díky panu Stachovi. Jen...
Pátek, 12 Květen 2017 - 08:58 | Marek Moravčík | NVIDIA na ňom prezentovala aj niečo z grafiky:...
Pátek, 12 Květen 2017 - 08:26 | Jakub Lindauer | Spíš kde se u GV100 hovoří o jakékoli podpoře pro...
Pátek, 12 Květen 2017 - 06:44 | del42sa | bouchni šampáňo Bedřichu :-)
Pátek, 12 Květen 2017 - 02:29 | Hrdina | A přespříští bude 3D, čili koule... ideálně...
Pátek, 12 Květen 2017 - 01:15 | Much Doge | Co když mají i variantu co má opravdu seříznuté...

Zobrazit diskusi