Nsight 工具 – 計算 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 17 Jun 2025 07:56:01 +0000
zh-CN
hourly
1
196178272 -
使用 NVIDIA Nsight Profiler 簡化 EDF 流體動力學模擬的 GPU 移植
http://www.open-lab.net/zh-cn/blog/streamlining-gpu-porting-for-edfs-fluid-dynamics-simulations-with-nvidia-nsight-profilers/
Thu, 12 Jun 2025 07:52:36 +0000
http://www.open-lab.net/zh-cn/blog/?p=14254
Continued]]>
將現有 CPU 應用程序移植到 NVIDIA GPU 可以釋放性能提升,使用戶能夠以更大的規模和更快的速度解決問題。雖然修改代碼以實現 NVIDIA GPU 加速需要在初始階段投入時間和精力,但由此帶來的吞吐量和效率提升通常遠遠超過成本。 這樣的任務可能看起來令人生畏,并引起了人們的擔憂,因為他們會浪費時間,最終產生無法提供任何好處的半移植 CPU 代碼到 GPU 代碼。但是,將 CPU 代碼移植到 GPU 代碼可以逐步完成,從而實現即時加速并更大限度地降低風險。 在整個移植過程中,如果不需要先進的內核優化技術,將單個任務從 CPU 移植到 GPU 可提供顯著的加速和下游性能優勢,則經常會出現這種情況。 無論您是初學者還是資深 NVIDIA CUDA 開發者,NVIDIA Nsight 工具套件都支持整個移植流程。只需輕松設置 NVIDIA Nsight Systems,
Source
]]>
14254
-
CUDA 工具包現已支持 NVIDIA Blackwell 架構
http://www.open-lab.net/zh-cn/blog/cuda-toolkit-12-8-delivers-nvidia-blackwell-support/
Fri, 31 Jan 2025 04:55:11 +0000
http://www.open-lab.net/zh-cn/blog/?p=12892
Continued]]>
CUDA 工具包 的最新版本 (版本 12.8) 使用最新的 NVIDIA CPU 和 GPU,持續提升數據科學、AI、科學計算以及計算機圖形和模擬領域的加速計算性能。本文重點介紹了此版本包含的一些新功能和增強功能: CUDA 工具包 12.8 是該工具包的第一個版本,在整個開發者工具套件 (包括性能工具和分析器、庫和編譯器) 中支持 NVIDIA Blackwell 架構。Blackwell 由 208 億個晶體管構建而成,是 NVIDIA Hopper GPU 中晶體管數量的 2.5 倍以上,是迄今為止最大的 GPU。 Blackwell 支持的主要功能包括:Key Blackwell 如需詳細了解 NVIDIA Blackwell 的領先創新,請參閱 NVIDIA Blackwell 架構技術概覽。 借助 Blackwell,
Source
]]>
12892
人人超碰97caoporen国产