Brian Tepera – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 10 Jul 2025 06:38:11 +0000
zh-CN
hourly
1
196178272 -
RAPIDS 新增 GPU Polars 串流、統一 GNN API 和零代碼 ML 加速功能
http://www.open-lab.net/zh-cn/blog/rapids-adds-gpu-polars-streaming-a-unified-gnn-api-and-zero-code-ml-speedups/
Thu, 03 Jul 2025 06:36:03 +0000
http://www.open-lab.net/zh-cn/blog/?p=14541
Continued]]>
RAPIDS 是一套用于 Python 數據科學的 NVIDIA CUDA-X 庫,發布了 25.06 版本,引入了令人興奮的新功能。其中包括 Polars GPU 流引擎、用于圖形神經網絡 (GNN) 的統一 API,以及用于支持向量機的加速 (無需更改代碼) 。在這篇博文中,我們將探討其中一些更新。 2024 年 9 月,我們與 Polars 團隊合作推出了基于 NVIDIA cuDF 構建的 Polars GPU 引擎。25.06 版本對 Polars GPU 引擎功能進行了一些重大更新。 在 25.06 版本中,我們在 Polars GPU 引擎中引入了流式傳輸執行。流式傳輸執行程序利用數據分區和并行處理,支持在大于 VRAM 的數據集上執行。要使用此新的流式傳輸執行程序,用戶可以將適當配置的 GPUEngine 對象傳遞給 Polars 調用:
Source
]]>
14541
-
如何在 Polars GPU 引擎中處理超過 VRAM 的數據
http://www.open-lab.net/zh-cn/blog/how-to-work-with-data-exceeding-vram-in-the-polars-gpu-engine/
Fri, 27 Jun 2025 04:08:28 +0000
http://www.open-lab.net/zh-cn/blog/?p=14462
Continued]]>
在量化金融、算法交易和欺詐檢測等高風險領域,數據從業者經常需要處理數百 GB 的數據,才能快速做出明智的決策。Polars 是發展最快的數據處理庫之一,其 GPU 引擎由 NVIDIA cuDF 提供動力支持,可加速這些領域常見的計算受限查詢,從而滿足這一需求。 但是,在使用 GPU 時,一個常見的挑戰是 VRAM ( GPU 的專用內存) 通常小于系統 RAM。在使用 GPU 引擎處理非常大的數據集時,這可能會導致問題。 本文將探討 Polars GPU 引擎中克服此限制的兩個選項。借助這些策略,您可以處理大于可用 VRAM 的數據,同時仍可從 GPU 加速中獲益: 當數據集大小開始超過 GPU 顯存時,您可以利用 NVIDIA UVM 技術。 UVM 在系統 RAM (主機內存) 和 GPU VRAM (設備內存) 之間創建統一的內存空間。
Source
]]>
14462
-
NVIDIA cuML 為 scikit-learn 帶來零代碼更改加速
http://www.open-lab.net/zh-cn/blog/nvidia-cuml-brings-zero-code-change-acceleration-to-scikit-learn/
Tue, 18 Mar 2025 05:59:53 +0000
http://www.open-lab.net/zh-cn/blog/?p=13333
Continued]]>
Scikit-learn 是應用最廣泛的 ML 庫,因其 API 簡單、算法多樣且與 pandas 和 NumPy 等熱門 Python 庫兼容,因此在處理表格數據方面備受歡迎。現在,NVIDIA cuML 使您能夠繼續使用熟悉的 Scikit-learn API 和 Python 庫,同時使數據科學家和機器學習工程師能夠在 NVIDIA GPU 上利用 CUDA 的強大功能,而無需更改任何應用代碼。 在 NVIDIA cuML 25.02 中,我們將在公測版中發布無需更改代碼即可加速 scikit-learn 算法的功能。2019 年首次推出的 NVIDIA cuML 已迅速為 Python 機器學習添加基于 CUDA 的 GPU 算法。借助最新版本,數據科學家和機器學習工程師能夠保持 scikit-learn 應用不變,并在 NVIDIA GPU 上實現比 CPU 快 50…
Source
]]>
13333
-
利用 RAPIDS cuML 加速時間序列預測
http://www.open-lab.net/zh-cn/blog/accelerating-time-series-forecasting-with-rapids-cuml/
Thu, 16 Jan 2025 06:20:40 +0000
http://www.open-lab.net/zh-cn/blog/?p=12696
Continued]]>
時間序列預測是一種強大的數據科學技術,用于根據過去的數據點預測未來值 借助 skforecast 等開源 Python 庫,您可以輕松地對數據運行時間序列預測。它們允許您“自帶”與 scikit-learn API 兼容的回歸器,讓您能夠靈活地與所選模型無縫協作。 隨著數據集和技術(例如直接多步驟預測)的不斷增加,需要您一次運行多個模型,在基于 CPU 的基礎設施上運行預測時,計算成本會很快變得昂貴。 RAPIDS 是開源 GPU 加速數據科學和 AI 庫的集合。 cuML 是一個 GPU 加速的 Python 機器學習庫,具有 scikit-learn 兼容 API。 在這篇博文中,我們展示了如何將 RAPIDS cuML 與 skforecast 結合使用,以加速時間序列預測,從而讓您能夠處理更大的數據集和預測窗口。 在當今數據驅動的世界中,
Source
]]>
12696
人人超碰97caoporen国产