圖形算法 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Wed, 06 Nov 2024 09:19:43 +0000 zh-CN hourly 1 196178272 RAPIDS cuML 助力 GPU 實現 UMAP 的高速擴展 http://www.open-lab.net/zh-cn/blog/even-faster-and-more-scalable-umap-on-the-gpu-with-rapids-cuml/ Thu, 31 Oct 2024 09:15:25 +0000 http://www.open-lab.net/zh-cn/blog/?p=11843 Continued]]> UMAP 是一種常用的降維算法,用于生物信息學、NLP 主題建模和 ML 預處理等領域。它的工作原理是創建 k 近鄰(k-NN)圖(在文獻中稱為全近鄰圖),以構建數據的模糊拓撲表示,用于將高維數據嵌入到較低維度中。 RAPIDS cuML 已經包含了加速的 UMAP,與最初基于 CPU 的 UMAP 相比,速度有了顯著提升。正如我們在本文中演示的那樣,還有改進空間。 在本文中,我們將探討如何使用 RAPIDS cuML 24.10 中引入的新功能。我們還將深入探討 nn-descent 算法和批處理流程的詳細信息。最后,我們分享基準測試結果,以強調可能的性能提升。在本文結束時,我們希望您對 RAPIDS 更快速且可擴展的 UMAP 所帶來的優勢感到興奮。 我們面臨的一個挑戰是,所有鄰居圖形構建階段需要很長時間,尤其是與 UMAP 算法中的其他步驟相比。

Source

]]>
11843
用于直線 CUDA 圖形和其他性能增強的恒定時間啟動 http://www.open-lab.net/zh-cn/blog/constant-time-launch-for-straight-line-cuda-graphs-and-other-performance-enhancements/ Wed, 11 Sep 2024 08:11:14 +0000 http://www.open-lab.net/zh-cn/blog/?p=11288 Continued]]> CUDA Graphs 是一種將 GPU 運算定義為圖形(而非一系列流啟動)并將其批量處理的方法。CUDA Graph 將一組 CUDA 內核和其他 CUDA 運算分組在一起,并使用指定的依賴關系樹執行這些運算。它將與 CUDA 內核啟動和 CUDA API 調用相關的驅動程序活動結合起來,從而加快工作流程。它還可以執行與硬件加速的依賴關系,而不是在可能的情況下僅依賴 CUDA 流和事件。 CUDA 圖形對于 AI 框架尤為重要,因為它們使您能夠捕獲和回放一系列 CUDA 操作,從而降低 CPU 開銷并提高性能。借助最新的改進,您現在可以更好地利用 CUDA 圖形來加速 AI 工作負載。 在 CUDA 工具包 11.8 和 CUDA 工具包 12.6 以及隨附的驅動程序版本之間,NVIDIA 在幾個方面提高了 CUDA 圖形的性能: 在本文中,

Source

]]>
11288
借助 GPU-CPU 融合大規模增強圖形分析,實現 100 倍性能 http://www.open-lab.net/zh-cn/blog/supercharge-graph-analytics-at-scale-with-gpu-cpu-fusion-for-100x-performance/ Fri, 13 Oct 2023 06:13:41 +0000 http://www.open-lab.net/zh-cn/blog/?p=8015 Continued]]> 圖形是許多現代數據和分析功能的基礎,可在不同的數據資產中查找人、地點、事物、事件和位置之間的關系。根據一項研究,到 2025 年,圖形技術將被用于 80% 的數據和分析創新,這將有助于促進跨組織的快速決策。 在處理包含數百萬個節點的圖形時,CPU 上的 Louvain 等算法的執行時間可能長達幾個小時。這種長時間的處理時間不僅會影響開發者的工作效率,而且會導致總體性能結果欠佳。 利用 GPU 的并行處理能力可以顯著縮短圖形訓練時間。基準測試結果表明,GPU 加速在將基于 CPU 的計算速度提高 100 倍以上方面具有巨大潛力。 這種顯著的速度提升展示了將 GPU 集成到 圖形分析 (graph analytics) 可以實現 100 倍的性能提升。 這種顛覆性架構的核心是以下三個關鍵組件,每個組件都發揮著關鍵作用。

Source

]]>
8015
人人超碰97caoporen国产