Miguel Ferrer Avila – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 02 Feb 2023 09:15:53 +0000 zh-CN hourly 1 196178272 CUDA 12.0 編譯器使用 nvJitLink 庫支持運行時 LTO http://www.open-lab.net/zh-cn/blog/cuda-12-0-compiler-support-for-runtime-lto-using-nvjitlink-library/ Tue, 17 Jan 2023 09:12:42 +0000 http://www.open-lab.net/zh-cn/blog/?p=6157 Continued]]> CUDA Toolkit 12.0 引入了一個新的 nvJitLink 庫,用于實時鏈接時間優化( JIT LTO )支持。在 CUDA 的早期,為了獲得最大性能,開發人員必須在整個編程模式下將 CUDA 內核構建和編譯為單個源文件。這限制了 SDK 和應用程序具有大量代碼,跨越多個文件,需要從移植到 CUDA 進行單獨編譯。性能的提高與整個程序的編譯不符。 隨著 CUDA 工具包 11.2 的發布, NVCC 增加了對離線鏈接時間優化( LTO )的支持,以使單獨編譯的應用程序和庫能夠獲得與從單個翻譯單元編譯的完全優化程序類似的 GPU 運行時性能。在某些情況下,據報告,性能增益約為 20% 或更高。要了解更多信息,請參見 Improving GPU Application Performance with NVIDIA CUDA 11.2…

Source

]]>
6157
人人超碰97caoporen国产