2010年12月16日 星期四
2010年11月17日 星期三
NVIDIA 推出 CUDA Toolkit 3.2 正式版
NVIDIA 推出了 CUDA Toolkit 3.2 正式版。重要的新功能包括新的 CUDA 程式庫(包括稀疏矩陣程式庫 CUSPARSE、亂數產生器 CURAND、以及 H.264 壓縮/解壓縮程式庫),新的硬體支援(如 6GB Tesla 以及 TCC 模式),並支援 Intel ICC 11.1 編譯器(64 bits Linux 版本)。其它功能包括在 kernel 中支援記憶體管理功能(malloc 及 free)以及 NVIDIA SMI 介面可用於存取各種 GPU 相關效能數據。
不幸的是,CUDA Toolkit 3.2 的 OpenCL 仍為 1.0 版。
不幸的是,CUDA Toolkit 3.2 的 OpenCL 仍為 1.0 版。
2010年11月16日 星期二
Intel 推出 Alpha 版 OpenCL SDK
Intel 推出了 alpha 版的 OpenCL SDK,支援 OpenCL 1.1。目前此 OpenCL SDK 只支援 Intel Core 處理器以及 32 bits 應用程式。它支援以下功能:
- 亂序執行
- Native kernel
- Image 支援
- Compiler 最佳化選項
- 雙精度浮點數
- 從 OpenGL context 建立 OpenCL context
- 和 OpenGL 共用 memory object、buffer、貼圖等
2010年8月12日 星期四
AMD 推出 ATI Stream SDK 2.2 版
AMD 推出了新的 ATI Stream SDK 2.2 版。新功能包括:
- 支援 OpenCL 1.1 (只限於 RV870 等級 GPU)
- 支援 SSE2 CPU
- 支援 Visual Studio 2010 以及 MinGW GCC 4.4 版
- 在 Linux 上支援 GCC 4.1 版
- 支援單通道 OpenCL image
- 支援 OpenCL 與 DirectX 10 資料交換
- 支援更多雙精度浮點數函式
- 支援產生以及載入二進位格式之 OpenCL kernel
- 支援 CPU 二進位碼之 OpenCL kernel
- (預覽功能)支援存取更大的實體記憶體
- (預覽功能)支援 OpenCL kernel 中使用 printf 函式
- (延伸功能)在 OpenCL 1.1 中支援更多事件狀態
- 增加更多 OpenCL 範例程式碼
- 增加 ATI Stream Profiler 1.4
- 多項 OpenCL 編譯器的修正及改善
- 更完整的 OpenCL 最佳化指南
2010年7月26日 星期一
OpenGL ARB 推出 OpenGL 4.1 規格
OpenGL ARB 推出了 OpenGL 4.1 規格。OpenGL 4.1 核心規格的主要新功能包括:
- 強化和 OpenGL ES 2.0 的相容性,將之前 OpenGL ES 2.0 中包含,但 OpenGL 4.0 中沒有的功能加入 OpenGL 4.1 中(GL_ARB_ES2_compatibility)。
- 提供取得以及設定 OpenGL 程式物件的二進位格式的功能(GL_ARB_set_program_binary)。
- 提高最低支援的貼圖以及著色區塊的大小。
- 提供混合分開編譯的 shader 物件的功能(GL_ARB_separate_shader_objects)
- 在 OpenGL Shading Language Specification 中釐清一些和精確度要求相關的限制(GL_ARB_shader_precision)
- OpenGL Shading Language 中,vertex shader 可以接受 64 位元浮點數輸入值(GL_ARB_vertex_attrib_64bit)
- 提供多 viewport 功能給 geometry shader 以及多 frame buffer、以及浮點數的 viewport 範圍(GL_ARB_viewport_array)。
2010年7月21日 星期三
NVIDIA 推出 Parallel Nsight 1.0
NVIDIA 推出 Parallel Nsight 1.0 GPU 發展工具。Parallel Nsight 可以和 Microsoft Visual Studio 配合,提供直接在 GPU 上進行 debug、觀察 GPU 記憶體內容、設定中斷點、以及檢測是否有不良記憶體存取動作等。Parallel Nsight 專業版則另外提供了進一步的分析工具,可以分析 CUDA 程式的事件(包括 API 呼叫、記憶體傳輸等),並透過 GPU 內建之效能計數器分析 CUDA 程式的效率。在繪圖方面,Parallel Nsight 1.0 也可針對 HLSL shader 進行 debug 與效率分析的動作。
Parallel Nsight 1.0 標準版為免費提供,而專業版則有限時免費試用版。
Parallel Nsight 1.0 標準版為免費提供,而專業版則有限時免費試用版。
2010年6月26日 星期六
NVIDIA 推出 CUDA 3.1 Toolkit
NVIDIA 推出了 CUDA 3.1 Toolkit。CUDA 3.1 主要的新功能包括:
- GPUDirect(tm) 技術,讓三方裝置可以直接存取 CUDA 記憶體
- 在 Fermi GPU 上支援最多同時執行 16 個不同 kernel 的功能
- 讓 CUDA Driver API、Runtime API、及數學程式庫可以共用資料
- 新的程式語言功能,包括:支援 printf()、函式指標、及遞迴
- 新的 Visual Profiler 同時支援 CUDA 及 OpenCL
- 數學程式庫的加強
- 更多的 SDK 程式範例
訂閱:
文章 (Atom)