Numba – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Wed, 12 Mar 2025 06:05:35 +0000 zh-CN hourly 1 196178272 使用 Numba 將 GPU 加速的算法交易模擬提高 100 多倍 http://www.open-lab.net/zh-cn/blog/gpu-accelerate-algorithmic-trading-simulations-by-over-100x-with-numba/ Tue, 04 Mar 2025 05:53:40 +0000 http://www.open-lab.net/zh-cn/blog/?p=13140 Continued]]> 量化開發者需要運行回測模擬,以便從損益(P&L)的角度了解金融算法的表現。統計技術對于根據可能的損益路徑可視化算法的可能結果非常重要。GPU 可以大大減少執行此操作所需的時間。 從更廣泛的角度來看,金融市場的數學建模是一種實踐,可以追溯到榮獲諾貝爾獎的 Black-Scholes 模型 (1973 年)。它在當時是革命性的,從那時起就影響了資本市場。統計 Monte Carlo 模擬的方法是表示使用 Brownian motion 模型可實現的價格路徑,該方法涉及根據市場在檢查市場微觀結構時的行為方式定制的自定義模型。 本文介紹了適用于金融市場市場參與者的硬件加速研究。市場參與者可以是: 這些市場參與者都在全球的交易所中開展協作,在這些交易所中,有一套關于價格、交易量和時間的非常具體的規則,稱為交易證券的動態訂單薄。 由于定價數據龐大且執行速度快,

Source

]]>
13140
使用 Numbast 實現 CUDA C++ 生態系統與 Python 開發者之間的無縫連接 http://www.open-lab.net/zh-cn/blog/bridging-the-cuda-c-ecosystem-and-python-developers-with-numbast/ Thu, 24 Oct 2024 04:51:36 +0000 http://www.open-lab.net/zh-cn/blog/?p=11681 Continued]]> 通過支持使用 Python 編寫 CUDA 內核函數,類似于在 C++中實現內核函數的方式,Numba 彌合了 Python 生態系統與 CUDA 性能之間的差距。 但是,CUDA C++開發者可以訪問許多目前未在 Python 中公開的庫,包括 CUDA 核心計算庫(CCCL)、cuRAND 以及頭文件實現的數字類型,例如 bfloat16 等。 雖然每個 CUDA C++ 庫都可以用自己的方式介紹給 Python,但是手動為每個庫進行綁定是一項費力、重復的工作,并且容易出現不一致。例如,float16 和 bfloat16 數據類型定義了 60 多個類似的獨立函數,這兩種類型都需要多次類似的綁定。 此外,當底層 CUDA C++庫引入新功能時,手動創建的綁定通常會不同步。 Numba 建立自動化工作流,將 CUDA C/C++API 轉換為 Numba 綁定。

Source

]]>
11681
使用 PyOptiX 的 Nuba 擴展在 Python 中編寫光線跟蹤應用程序 http://www.open-lab.net/zh-cn/blog/writing-ray-tracing-apps-in-python-using-numba-for-pyoptix/ Wed, 01 Jun 2022 03:27:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4254 Continued]]> 光線跟蹤是一種渲染算法,它可以通過模擬光如何傳輸以及與不同材質的交互來生成照片級真實感圖像。如今,它被廣泛應用于游戲開發、電影制作和物理模擬中,將圖像帶入生活。 然而,光線跟蹤算法計算量大,需要在 GPU 上進行硬件加速才能實現實時性能。 為了利用光線跟蹤的硬件功能,人們發明了各種工具鏈和語言來滿足需要,例如 openGL 和著色語言。 通常,這些軟件工具鏈的構建過程會給 Python 開發人員帶來重大挑戰。為了減輕困難并為編寫光線跟蹤內核提供熟悉的環境, NVIDIA 為 PyOptiX 開發了 Numba 擴展。這種擴展使圖形研究人員和應用程序開發人員能夠減少從構思到實現的時間,并縮短每次迭代的開發周期。 在本文中,我將概述 NVIDIA 光線跟蹤引擎 PyOptiX ,并解釋 Python JIT 編譯器 Numba 如何加速 Python 代碼。最后,

Source

]]>
4254
在 Python 中加速與 Numba 和 Dask 的投資組合構建 http://www.open-lab.net/zh-cn/blog/accelerated-portfolio-construction-with-numba-and-dask-in-python/ Thu, 21 Oct 2021 07:21:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2043 Continued]]> Python 對數據科學家來說并不陌生。它是最流行的計算機語言,廣泛用于各種任務。盡管 Python 在運行時解釋代碼時速度非常慢,但對于某些數據科學工作,許多流行的庫使其在 GPU 上高效運行。例如,TensorFlow和PyTorch等流行的深度學習框架可以幫助 AI 研究人員高效地運行實驗。然而,在某些領域,如投資組合優化,沒有 Python 庫可以輕松加速計算工作。開發人員必須從頭開始實現算法,才能在 GPU 上加速。 在這篇文章中,我們將展示如何使用 Numba 和Dask將投資組合構建算法加速 800x ,如以前的博客中介紹的那樣。 Numba 是一個 cuDF 庫,它簡化了 GPU 算法與 Python 的實現。 Python GPU 內核可以編譯為在 GPU 上運行。它使 CUDA 的編寫更易于 Python 開發人員使用。對于不適合單個 GPU 的較大問題,

Source

]]>
2043
人人超碰97caoporen国产