【CPU】簡化並行編程，NVIDIA正式發布CUDA 4.0開發包

[複製連結] 檢視: 610|回覆: 0

CANCERS

名望的勇者

電梯直達

1^#

發表於 11-3-1 00:00:00 |只看該作者 |降序瀏覽大字中字小字正體化简体化

　　近日，NVIDIA正式發布了GPU通用計算CUDA 4.0開發包。與稍早版本相比，該開發包簡化了並行編程，可讓更多的開發人員順利進行程序移植。

　　CUDA 4.0包括以下三大主要特性：

一、GPUDirect 2.0技術

　　在GPUDirect 2.0之前，同一系統內的GPU需經由CPU和系統記憶體方可訪問對方記憶體的數據，而GPUDirect 2.0技術能讓同一系統內的GPU不經CPU和記憶體就能互相共享記憶體內的數據，大大縮短了數據處理和傳輸的時間。
二、統一虛擬定址技術

　　統一虛擬定址技術可以簡化通用計算編程的定址空間設計，而讓開發者無需要考慮CPU和GPU各自的記憶體空間。其通過將所有所有記憶體定址空間整合為一個的方式，大大簡化了並行編程的工作。
三、Thrust C++模板高性能基元庫

　　Thrust C++模板高性能基元庫能夠為開發人員提供多種C++並行算法和資料結構，讓開發人員輕鬆使用CUDA通用編程。
CUDA 4.0的新特性還包括:
- MPI與CUDA應用程序相結合。
- GPU多執行緒共享。
- 單CPU執行緒共享多GPU。
- 全新的NPP圖像與電腦視覺庫。
- Visual Profiler中的自動性能分析功能。
- Cuda-gdb中增添新特性以及對Mac OS新增支援。
- 新增對C++特性支援。

　　根據NVIDIA表示，CUDA 4.0必須搭配Fermi核心的GPU方可使用，而操作系統方面則支援Windows/Mac OS X/Linux等。

轉播0 分享0 收藏0

回覆使用道具檢舉

最後更新返回清單

帳號		自動登入	取回密碼
密碼			註冊

【CPU】 簡化並行編程，NVIDIA正式發布CUDA 4.0開發包

CANCERS

【CPU】簡化並行編程，NVIDIA正式發布CUDA 4.0開發包