近日,NVIDIA正式發布了GPU通用計算CUDA 4.0開發包。與稍早版本相比,該開發包簡化了並行編程,可讓更多的開發人員順利進行程序移植。
CUDA 4.0包括以下三大主要特性:
一、GPUDirect 2.0技術
在GPUDirect 2.0之前,同一系統內的GPU需經由CPU和系統記憶體方可訪問對方記憶體的數據,而GPUDirect 2.0技術能讓同一系統內的GPU不經CPU和記憶體就能互相共享記憶體內的數據,大大縮短了數據處理和傳輸的時間。
二、統一虛擬定址技術
統一虛擬定址技術可以簡化通用計算編程的定址空間設計,而讓開發者無需要考慮CPU和GPU各自的記憶體空間。其通過將所有所有記憶體定址空間整合為一個的方式,大大簡化了並行編程的工作。
三、Thrust C++模板高性能基元庫
Thrust C++模板高性能基元庫能夠為開發人員提供多種C++並行算法和資料結構,讓開發人員輕鬆使用CUDA通用編程。
CUDA 4.0的新特性還包括:
- MPI與CUDA應用程序相結合。
- GPU多執行緒共享。
- 單CPU執行緒共享多GPU。
- 全新的NPP圖像與電腦視覺庫。
- Visual Profiler中的自動性能分析功能。
- Cuda-gdb中增添新特性以及對Mac OS新增支援。
- 新增對C++特性支援。
根據NVIDIA表示,CUDA 4.0必須搭配Fermi核心的GPU方可使用,而操作系統方面則支援Windows/Mac OS X/Linux等。 |