Nvidia CUDA 6.5 přináší 64bit ARM a rychlejší double-precision
Mezi novinkami je oficiální podpora pro 64bit ARM architekturu (příprava na Denver architekturu, ale Nvidia v této sovuislosti hovoří i o současných testovacích platformách s 8jádrovým ARMem Applied Micro X-Gene na 2,4 GHz doprovázenými kartami Tesla K20), cuFFT device callback support, podpora nástrojů pro jazyk Fortran, API pro Occupancy Calculator API, vyší výkon v double-precision, statické knihovny na Linuxu, vylepšení výkonu v multiprocesorových službách a mnoho dalšího.
Pro Fortran je zde aktualizovaný debugger cuda-gdb a profiler nvprof, zatím je ale podpora v beta stádiu a vyžaduje kompilátor PGI 14.4 (nebo vyšší). Na platformě Windows je podporováno Microsoft Visual Studio 2013, klíčové matematické knihovny pak prodělaly optimalizace, takže dávají vyšší výkon v double-precision. N-body gravitační simulace na Tesle K40, která doteď běžela s výkonem 698 GFLOPS, na CUDA 6.5 dává výkon 801 fp64 GFLOPS. Je zde dále nový nástroj nvprune, který umí z knihoven a objektových souborů vyházet vše, co nesouvisí s kódem vykonavatelným daným zařízením s danou architekturou. Dále zrychluje multiprocesorová služba, kupříkladu latence při startu klesla z 7 na 5 µs, latence při synchronizaci z 35 na 15 µs. Vylepšen je i Xid error reporting, nové knihovny pak zajišťují lepší škálování výkonu až do 8 GPU a podporují úlohy až do velikosti 512 GB.
Nové vydání je k dispozici pro Windows, stejně jako Mac OS X a rozličné linuxové distribuce jako Fedora 20, openSUSE 13.1, RHEL / CentOS 6 a 5, SUSE Linux Enterprise Server 11 SP1, SteamOS 1.0, Ubuntu 12.04 LTS a 14.04 LTS.