Diit.cz - Novinky a informace o hardware, software a internetu

Nvidia CUDA 4.1: více než 1000 nových funkcí a o 10 % rychlejší běh

Nvidia CUDA 4.1 logo
Nvidia právě v této době slaví pět let od nastartování GPGPU projektu CUDA. Jak jsme již dříve psali, CUDA 4.1 (nyní konečně uvedená ve finální verzi), přichází s několika zajímavými novinkami. Lze ji brát jako další práci Nvidie na jejím piplaném dítku, nebo svého druhu snahu bránit se nástupu OpenCL?

Nvidia CUDA 4.1 prezentace

Připomeňme na úvod, že před měsíce se stal kompilátor CUDA otevřeným. Do budoucna díky použití LLVM mohou přijít jak další programovací jazyky pro GPU (LLVM je vlastně takový infrastrukturní podklad pro kompilátory programovacích jazyků, ve spojení s C/C++ backendem Clang je využíván např. ve FreeBSD), tak hlavně doplnění CUDA o podporu jiných architektur, kde Nvidia explicitně zmiňuje možnost doplnění o podporu GPU jiných výrobců či dalších procesorů obecně - tímto tedy berte za oficiálně potvrzené Nvidií, že CUDA již není uzavřená platforma pro její GPU, ale je v možnostech komunity či vývojářů doplnit si CUDA o podporu CPU/GPU AMD, Intel či jiných (ARM, VIA atd.).

Nvidia CUDA 4.1 prezentace

Díky přechodu k LLVM doznává CUDA 4.1 zhruba o 10 % vyššího výkonu než dosud, což je rozhodně pozitivum. Ukazuje to, jak dobrou práci tvůrci LLVM odvádí a právě s ohledem na FreeBSD i další projekty je jasné, že LLVM není nic malého, co časem zanikne - však také podpora Nvidie projektu jistě prospěje.

Novinkou mezi knihovnami obsaženými v CUDA 4.1 je více než tisícovka nových funkcí pro zpracování obrazu. Jejich počet v knihovně NPP (Nvidia Performance Primitives) vzrostl prakticky na dvojnásobek. Pro zajímavost: Nvidia udává s jednou kartou Tesla C2050 až 40× vyšší výkon, než jaký dává knihovna Intel IPP na dvouprocesorovém stroji s Core i7-920.

Nvidia CUDA 4.1 prezentace Nvidia CUDA 4.1 prezentace

Dále Nvidia přichází s upraveným Visual Profilerem a snad jen pro úplnost připomeňme to, co přišlo s Fermi architekturou: další vylepšení v oblasti Nsight, tedy podpory MS Visual Studia. Dále je zde podpora pro 3D surfaces a cube maps, peer-to-peer (P2P) komunikaci mezi procesy (kde Nvidia v jiné prezentaci upozorňuje, že zatímco s GPU kartami v PCI Express slotech to jde, protože PCI Express toto obecně podporuje, sběrnice Intel QPI, skrze kterou komunikují Intel CPU, toto neumí).

Verze 4.1 dále vylepšuje některé prvky jako třeba FFT (rychlá Fourierrova transformace), rychlost 3D transformací, přidává kompletní implementaci rutin pro lineární algebru, zrychlení kolem výpočtů s maticemi a mnohé další.

Nejen CUDA 4.1 bude předmětem chystané GPU Technology Conference 2012 plánované na 14. až 17. května 2012 v kalifornském San Jose. CUDA Toolkit 4.1 i příslušné ovladače jsou ke stažení u Nvidie. Opět vám naservírujeme ještě kompletní prezentaci.

Tagy: 
Zdroje: 

Nvidia

Galerie ke článku

David "David Ježek" Ježek

Bývalý zdejší redaktor (2005-2017), nyní diskusní rejpal.

více článků, blogů a informací o autorovi

Diskuse ke článku Nvidia CUDA 4.1: více než 1000 nových funkcí a o 10 % rychlejší běh

Pátek, 10 Únor 2012 - 08:28 | ne ne | "Nvidia udává s jednou kartou Tesla C2050 až...

Zobrazit diskusi