Nvidia CUDA 6.5 přináší 64bit ARM a rychlejší double-precision

21. 8. 2014 | David Ježek | Novinky, Grafiky, Software, Linux

Nová verze GPGPU frameworku od Nvidie značně vylepšuje mnohé klíčové aspekty, majitelé karet Nvidia, kteří se GPGPU úlohám věnují, mohou dnes otevřít šampaňské.

Mezi novinkami je oficiální podpora pro 64bit ARM architekturu (příprava na Denver architekturu, ale Nvidia v této sovuislosti hovoří i o současných testovacích platformách s 8jádrovým ARMem Applied Micro X-Gene na 2,4 GHz doprovázenými kartami Tesla K20), cuFFT device callback support, podpora nástrojů pro jazyk Fortran, API pro Occupancy Calculator API, vyší výkon v double-precision, statické knihovny na Linuxu, vylepšení výkonu v multiprocesorových službách a mnoho dalšího.

Pro Fortran je zde aktualizovaný debugger cuda-gdb a profiler nvprof, zatím je ale podpora v beta stádiu a vyžaduje kompilátor PGI 14.4 (nebo vyšší). Na platformě Windows je podporováno Microsoft Visual Studio 2013, klíčové matematické knihovny pak prodělaly optimalizace, takže dávají vyšší výkon v double-precision. N-body gravitační simulace na Tesle K40, která doteď běžela s výkonem 698 GFLOPS, na CUDA 6.5 dává výkon 801 fp64 GFLOPS. Je zde dále nový nástroj nvprune, který umí z knihoven a objektových souborů vyházet vše, co nesouvisí s kódem vykonavatelným daným zařízením s danou architekturou. Dále zrychluje multiprocesorová služba, kupříkladu latence při startu klesla z 7 na 5 µs, latence při synchronizaci z 35 na 15 µs. Vylepšen je i Xid error reporting, nové knihovny pak zajišťují lepší škálování výkonu až do 8 GPU a podporují úlohy až do velikosti 512 GB.

Nové vydání je k dispozici pro Windows, stejně jako Mac OS X a rozličné linuxové distribuce jako Fedora 20, openSUSE 13.1, RHEL / CentOS 6 a 5, SUSE Linux Enterprise Server 11 SP1, SteamOS 1.0, Ubuntu 12.04 LTS a 14.04 LTS.

Tagy: