Technologie a očekávané parametry K20
Kapitoly článků
Počet CUDA jader, parametry
Nvidia toto číslo zatím neuvádí. Pokud se ale probereme známými parametry, jako teoreticky nejnižší číslo nám z rovnice vylézá 2304. To ale neodpovídá úplně všemu, co v rovnicích máme, takže jsme s no-Xem dospěli k číslu - a potvrzují jej i zahraniční kolegové - 3072 CUDA jader, případně 2880. Die shot GPU totiž naznačuje existenci zvláštního počtu 15 výpočetních bloků a s obyčejným údajem o 192 CUDA jádrech na blok se dostáváme spíše k 2880. Ale víme jak to bývá s die-shoty v prezentacích, není to vytesáno do kamene, takže to může být zavádějící.
Každopádně s ohledem na analogii s GTX 480 a 580 a jim odpovídajících Tesla/Quadro karet předpokládáme následující parametry pro Teslu K20:
- 28nm GPU se 7,1 miliardami tr.
- při uvedení 2688 CUDA jader (jeden blok vypnutý, nejdříve v Q2/2013 přijde model s 2880 CUDA jádry)
- takt GPU: ~0,9 až 1,0 GHz (+ něco možná přidá GPU Boost)
- 384bit 7,0GHz GDDR5 paměti o velikosti 3 a 6 GB (ponese Quadro 7000 rovnou 12 GB?)
- TDP na úrovni řady Tesla 2000
- aktivně chlazený i pasivně chlazený model (s výběrovými GPU)
Pro Tesla a Quadro karty samozřejmě platí vysoká kvalita podpory nejen pro Windows, ale i Linux, BSD či Solaris.
Hyper-Q
Tato technologie umožňuje využívat výpočetní výkon systému tak, že určité množství CUDA jader na výpočetní kartě je využíváno jistým množstvím CPU jader. Způsob takového rozložení zátěže snižuje množství situací, kdy je CPU v klidovém režimu, neboť jeho jádra nemají co dělat, protože čekají na výstup(y) z GPU.
Dynamický paralelismus
Ten se pro změnu stará o to, aby bylo optimálně vytíženo GPU. Když nějaké výpočetní vlákno na GPU potřebuje další přídavné vlákno, tak si jej prostě založí bez nutnosti, aby do procesu vstupovalo hlavní CPU. Tímto lze na GPU plně přesunout řadu úkonů souvisejících s nejvyužívanějšími algoritmy v GPGPU světě jako třeba adaptive mesh refinement (AMR), fast multipole method (FMM) či multigrid method.