Eric Shi – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Wed, 08 Jan 2025 05:59:30 +0000
zh-CN
hourly
1
196178272 -
Warp 1.5.0 引入圖塊化編程
http://www.open-lab.net/zh-cn/blog/introducing-tile-based-programming-in-warp-1-5-0/
Sat, 14 Dec 2024 05:55:43 +0000
http://www.open-lab.net/zh-cn/blog/?p=12531
Continued]]>
借助最新版本的 Warp 1.5.0 ,開發者現在可以使用 Python 中基于圖塊的新編程基元。這些新工具利用 cuBLASDx 和 cuFFTDx ,在 Python 內核中為開發者提供高效的矩陣乘法和 Fourier 變換,從而加速仿真和科學計算。在這篇博文中,我們將介紹這些新功能,并展示如何使用它們來優化應用。Warp 1.5.0 中提供的基于圖塊的編程模型目前處于預覽階段,在即將推出的版本中,性能和 APIs 可能會發生變化。 在過去十年中,GPU 硬件已從單純的 SIMT (單指令多線程) 執行模型發展為高度依賴協作操作來提高效率的模型。隨著 Tensor Core 數學單元在整體 GPU 計算中的作用越來越大,高效且高效的編程變得越來越重要。高級 API 如 BLAS 提供的抽象概念可以面向各種高性能低級指令。但是,這些 API 通常難以與用戶程序集成,
Source
]]>
12531
人人超碰97caoporen国产