Diit.cz - Novinky a informace o hardware, software a internetu

Technologie a očekávané parametry K20

Nvidia GTC 2012
Na právě probíhající GPU Technology Conference došlo přesně na to ohlášení, které jsme očekávali: Nvidia představila plnohodnotný GPGPU čip Kepler a kromě něj samotného i odpovídající výpočetní karty. Vedle SuperKeplera ale mezi Tesly míří i obyčejný Kepler, tedy GPGPU variace na GeForce GTX 680, resp. GeForce GTX 690…

Kapitoly článků

2.  Technologie a očekávané parametry K20

Počet CUDA jader, parametry

Tesla K20 (GK110) - SMX bloky

Nvidia toto číslo zatím neuvádí. Pokud se ale probereme známými parametry, jako teoreticky nejnižší číslo nám z rovnice vylézá 2304. To ale neodpovídá úplně všemu, co v rovnicích máme, takže jsme s no-Xem dospěli k číslu - a potvrzují jej i zahraniční kolegové - 3072 CUDA jader, případně 2880. Die shot GPU totiž naznačuje existenci zvláštního počtu 15 výpočetních bloků a s obyčejným údajem o 192 CUDA jádrech na blok se dostáváme spíše k 2880. Ale víme jak to bývá s die-shoty v prezentacích, není to vytesáno do kamene, takže to může být zavádějící.

Každopádně s ohledem na analogii s GTX 480 a 580 a jim odpovídajících Tesla/Quadro karet předpokládáme následující parametry pro Teslu K20:

  • 28nm GPU se 7,1 miliardami tr.
  • při uvedení 2688 CUDA jader (jeden blok vypnutý, nejdříve v Q2/2013 přijde model s 2880 CUDA jádry)
  • takt GPU: ~0,9 až 1,0 GHz (+ něco možná přidá GPU Boost)
  • 384bit 7,0GHz GDDR5 paměti o velikosti 3 a 6 GB (ponese Quadro 7000 rovnou 12 GB?)
  • TDP na úrovni řady Tesla 2000
  • aktivně chlazený i pasivně chlazený model (s výběrovými GPU)

Pro Tesla a Quadro karty samozřejmě platí vysoká kvalita podpory nejen pro Windows, ale i Linux, BSD či Solaris.

Hyper-Q

Tesla K20 (GK110) - HyperQ

Tato technologie umožňuje využívat výpočetní výkon systému tak, že určité množství CUDA jader na výpočetní kartě je využíváno jistým množstvím CPU jader. Způsob takového rozložení zátěže snižuje množství situací, kdy je CPU v klidovém režimu, neboť jeho jádra nemají co dělat, protože čekají na výstup(y) z GPU.

Dynamický paralelismus

Tesla K20 (GK110) - dynamický paralelismus

Ten se pro změnu stará o to, aby bylo optimálně vytíženo GPU. Když nějaké výpočetní vlákno na GPU potřebuje další přídavné vlákno, tak si jej prostě založí bez nutnosti, aby do procesu vstupovalo hlavní CPU. Tímto lze na GPU plně přesunout řadu úkonů souvisejících s nejvyužívanějšími algoritmy v GPGPU světě jako třeba adaptive mesh refinement (AMR), fast multipole method (FMM) či multigrid method.

Tagy: 
Zdroje: 

Nvidia (1, 2)

Kapitoly článků
2.  Technologie a očekávané parametry K20

David "David Ježek" Ježek

Bývalý zdejší redaktor (2005-2017), nyní diskusní rejpal.

více článků, blogů a informací o autorovi

Diskuse ke článku Tesla K20: Nvidia představila SuperKeplera i duální Teslu

Čtvrtek, 17 Květen 2012 - 18:35 | dejvik | Doporučuju kvalitnější verzi keynote na youtube...
Čtvrtek, 17 Květen 2012 - 17:58 | bigless | Nepletete. Single precision performance na...
Čtvrtek, 17 Květen 2012 - 17:16 | Exhumanizator | nvidia ma podla vas predajnu kartu??? :))))) ta...
Čtvrtek, 17 Květen 2012 - 16:00 | maxprasak | Jaktoze v GK110 zadne integer jednotky navic...
Čtvrtek, 17 Květen 2012 - 15:25 | bigless | Nebo na přesdržku :) Alespoň známe jméno toho,...
Čtvrtek, 17 Květen 2012 - 15:04 | bigless | Ta poslední teorie o GK110 alias 680 je trochu...
Čtvrtek, 17 Květen 2012 - 14:25 | Jan Vlk | Časy se mění, Tesla K10 bývávalo tohle: http://...
Čtvrtek, 17 Květen 2012 - 12:46 | del42sa | It is clear that GK110 is all about compute,...
Čtvrtek, 17 Květen 2012 - 12:13 | del42sa | teda ten Huang je k nakousnutí :o)))

Zobrazit diskusi