Mark Wolf – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 17 Jun 2025 09:22:57 +0000
zh-CN
hourly
1
196178272 -
使用 NVIDIA Nsight Profiler 簡化 EDF 流體動力學模擬的 GPU 移植
http://www.open-lab.net/zh-cn/blog/streamlining-gpu-porting-for-edfs-fluid-dynamics-simulations-with-nvidia-nsight-profilers/
Thu, 12 Jun 2025 07:52:36 +0000
http://www.open-lab.net/zh-cn/blog/?p=14254
Continued]]>
將現有 CPU 應用程序移植到 NVIDIA GPU 可以釋放性能提升,使用戶能夠以更大的規模和更快的速度解決問題。雖然修改代碼以實現 NVIDIA GPU 加速需要在初始階段投入時間和精力,但由此帶來的吞吐量和效率提升通常遠遠超過成本。 這樣的任務可能看起來令人生畏,并引起了人們的擔憂,因為他們會浪費時間,最終產生無法提供任何好處的半移植 CPU 代碼到 GPU 代碼。但是,將 CPU 代碼移植到 GPU 代碼可以逐步完成,從而實現即時加速并更大限度地降低風險。 在整個移植過程中,如果不需要先進的內核優化技術,將單個任務從 CPU 移植到 GPU 可提供顯著的加速和下游性能優勢,則經常會出現這種情況。 無論您是初學者還是資深 NVIDIA CUDA 開發者,NVIDIA Nsight 工具套件都支持整個移植流程。只需輕松設置 NVIDIA Nsight Systems,
Source
]]>
14254
-
借助 AI 超級計算和 NVIDIA CUDA-Q Academic 變革量子教育
http://www.open-lab.net/zh-cn/blog/transforming-quantum-education-with-ai-supercomputing-and-nvidia-cuda-q-academic/
Tue, 10 Jun 2025 09:19:51 +0000
http://www.open-lab.net/zh-cn/blog/?p=14309
Continued]]>
隨著量子計算機的擴展,它們將與 AI 超級計算機集成,以解決世界上一些最具挑戰性的問題。這些加速量子超級計算機將運行利用 CPU、GPU 和 QPU 功能的應用程序。 借助 NVIDIA CUDA-Q 平臺,用戶可以輕松執行研究和開發應用程序,這些應用程序可以在加速量子超級計算機上無縫運行,集成任何 qubit 模態,也可以在模擬中運行。CUDA-Q 目前用于在學術界和行業中開發各種應用,包括模擬更好的量子硬件、研究 error correction 等。 目前,對教育資源的需求與日俱增,可以教會學生如何在加速量子超級計算機中使用能夠支持此類混合環境的工具。NVIDIA CUDA-Q Academic 旨在將理論與實踐相結合,彌合這一差距,讓新一代量子計算 (QC) 專業人員做好準備,使用 CUDA-Q 處理加速量子超級計算機。
Source
]]>
14309
-
聚焦:Infleqtion 利用 Q-CHOP 和 NVIDIA CUDA-Q Dynamics 進行投資組合優化
http://www.open-lab.net/zh-cn/blog/spotlight-infleqtion-optimizes-portfolios-using-q-chop-and-nvidia-cuda-q-dynamics/
Thu, 22 May 2025 06:16:57 +0000
http://www.open-lab.net/zh-cn/blog/?p=14072
Continued]]>
計算是現代金融服務行業必不可少的工具。根據指導財務決策的算法的速度和準確性,利潤是成敗的。 加速量子計算有可能通過能夠加速或增強現有工具 (例如投資組合優化技術) 的新算法來影響金融服務行業。本博文探討了 NVIDIA 合作伙伴 Infleqtion (一家全球性量子技術公司) 開發的一項新技術,該公司使用 NVIDIA CUDA-Q 平臺構建用于投資組合優化的混合量子經典算法。 投資組合優化的目標很簡單:選擇能夠最大限度地提高投資者回報的股票組合,同時最大限度地降低其面臨的波動性(風險)(圖 1)。 找到最佳投資組合的關鍵之一是確保其多元化,這意味著它包括更適合不斷變化的市場條件的各種股票。 Sharpe 比率量化給定風險水平的回報,高比率等同于更好的投資組合。也可以為單個股票計算 Sharpe 比率。它可以排除股票之間的協方差信息,
Source
]]>
14072
-
借助 NVIDIA cuBLAS 12.9 提高矩陣乘法速度和靈活性
http://www.open-lab.net/zh-cn/blog/boosting-matrix-multiplication-speed-and-flexibility-with-nvidia-cublas-12-9/
Thu, 01 May 2025 07:04:57 +0000
http://www.open-lab.net/zh-cn/blog/?p=13847
Continued]]>
NVIDIA CUDA-X 數學庫助力開發者為 AI、科學計算、數據處理等領域構建加速應用。 CUDA-X 庫的兩個最重要的應用是訓練和推理 LLM,無論是用于日常消費者應用,還是用于藥物研發等高度專業化的科學領域。要在 NVIDIA Blackwell 架構上高效訓練 LLM 和執行 具有突破性性能的推理任務 ,多個 CUDA-X 庫不可或缺。 cuBLAS 是一個 CUDA-X 庫,可提供高度優化的內核,用于執行最基本的線性代數任務,例如矩陣乘法 (matmuls) ,這些任務對于 LLM 訓練和推理至關重要。 NVIDIA CUDA 工具包 12.9 中新推出的 cuBLAS 支持進一步優化 cuBLAS matmul 性能的新功能。它還通過調整浮點精度和利用模擬的基礎模組,實現了更大的靈活性,以平衡準確性和能效等需求。 本文將介紹 cuBLAS 12.9…
Source
]]>
13847
-
NVIDIA Quantum 加速量子糾錯研究進程
http://www.open-lab.net/zh-cn/blog/accelerating-quantum-error-correction-research-with-nvidia-quantum/
Thu, 20 Mar 2025 07:28:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=13236
Continued]]>
噪聲是量子計算的著名對手。量子位對最細微的環境干擾很敏感,會迅速導致錯誤累積,并使最簡單的量子算法的結果過于雜亂而沒有意義。 量子糾錯 (QEC) 使用許多噪聲物理量子位來編碼邏輯量子位,從而有效避免噪聲,從而規避此問題。通過對噪聲物理量子位的某些子集反復執行測量來識別誤差,從而產生所謂的誤差綜合征。然后,可以對這些綜合征進行解碼,以推斷錯誤的性質和位置,以便跟蹤并最終修復這些錯誤,從而使量子算法能夠在不損壞的情況下完成。 識別高效的錯誤糾正協議并了解如何大規模實施這些協議,仍然是實現有用的量子計算必須解決的巨大挑戰。前面描述的解碼操作是一項主要挑戰,因為它必須在緊張的時間窗口內準確執行。增加代碼的復雜性可以提高對錯誤的保護,但會給解碼步驟帶來更大的壓力。 解碼意味著,實際且可擴展的量子糾錯需要在硬件架構中仔細集成經典計算資源和量子計算資源,該架構將 QPU 和 GPU…
Source
]]>
13236
-
NVIDIA CUDA-Q 在 Infleqtion QPU 上運行突破性邏輯 Qubit 應用
http://www.open-lab.net/zh-cn/blog/nvidia-cuda-q-runs-breakthrough-logical-qubit-application-on-infleqtion-qpu/
Tue, 10 Dec 2024 06:51:26 +0000
http://www.open-lab.net/zh-cn/blog/?p=12386
Continued]]>
Infleqtion 是中性原子量子計算領域的全球領導者,他們首先使用 NVIDIA CUDA-Q 平臺在其 Sqale 物理量子處理器 (QPU) 上進行模擬,然后編排邏輯量子位材料科學實驗的首次演示。 量子計算的基本信息單元 Qubits 容易出錯,并且非常不可靠,無法做出有意義的預測。邏輯量子位是許多噪點物理量子位的集合,它們對量子信息進行編碼以糾正錯誤,克服了這一限制。邏輯量子位可以執行耐環境噪聲和硬件故障的量子計算,也稱為容錯量子計算。 邏輯量子位的一個關鍵測試是觀察到,與其組成部分的噪聲物理量子位相比,錯誤率有所降低。Infleqtion 的結果在一系列輸入中令人信服地證明了這一點 (圖 1)。 這是邁向容錯量子計算的重要第一步,也是應用使用邏輯量子位的極少數物理演示之一。 本文將探討對這項突破性工作至關重要的 CUDA-Q 功能和性能。
Source
]]>
12386
-
NVIDIA cuDSS 庫推動美國電網優化無障礙發展
http://www.open-lab.net/zh-cn/blog/nvidia-cudss-library-removes-barriers-to-optimizing-the-us-power-grid/
Tue, 19 Nov 2024 09:08:57 +0000
http://www.open-lab.net/zh-cn/blog/?p=12194
Continued]]>
隨著電力需求不斷增長,電網的電力系統優化(PSO)對于確保高效的資源管理、可持續性和能源安全至關重要。 東部互聯是北美的主要電網,由大約 70,000 個節點組成 (圖 1)。除了規模龐大之外,此類電網的優化還因災難性天氣事件和發電中斷等不確定性而變得復雜。 PSO 通常涉及解決大規模非線性優化問題,例如交變電流最優功率流(ACOPF)模型,這些模型通常包含數百萬個變量和約束。實時獲得準確的結果對于保持電網穩定性和效率至關重要,但這是一項極其困難的任務。 Sungho Shin 教授 (MIT)、François Pacaud 教授 (MINES Paris – PSL) 和博士后研究員 Alexis Montoison (ANL) 一直在開發非線性優化算法和求解器,這些算法和求解器使用 NVIDIA 工具來解決大規模 PSO 和其他復雜的非線性優化問題。
Source
]]>
12194
-
隆重推出用于加速量子超級計算的 NVIDIA CUDA-QX 庫
http://www.open-lab.net/zh-cn/blog/introducing-nvidia-cuda-qx-libraries-for-accelerated-quantum-supercomputing/
Mon, 18 Nov 2024 09:35:58 +0000
http://www.open-lab.net/zh-cn/blog/?p=12000
Continued]]>
加速量子超級計算將人工智能超級計算的優勢與 量子處理器(QPUs) 相結合,為世界上一些最棘手的問題開發解決方案。實現此類設備需要將一個或多個 QPUs 無縫集成到傳統的 CPU 和 GPU 超級計算架構中。 任何加速量子超級計算機的基本組成部分都是與之交互的編程模型。這必須經過高度優化,不僅可以運行真正的混合量子經典應用,還可以同時管理對 QPU 硬件的控制。這涉及編排實時量子糾錯(QEC)等任務,這使得開發高性能和可擴展的混合應用極具挑戰性。 開源 NVIDIA CUDA-Q 平臺 正是提供了這樣一種編程模型,能夠幫助研究人員和開發者解決在實施加速量子超級計算方面的挑戰。 在 SC24 上,NVIDIA 宣布推出 CUDA-QX :這是 CUDA-Q 的擴展,由經過優化的庫組成,可直接提供 CUDA-Q 強大的編程模型,
Source
]]>
12000
-
借助新的量子動力學功能加速 Google 的 QPU 開發
http://www.open-lab.net/zh-cn/blog/accelerating-googles-qpu-development-with-new-quantum-dynamics-capabilities/
Mon, 18 Nov 2024 06:46:40 +0000
http://www.open-lab.net/zh-cn/blog/?p=12020
Continued]]>
量子動力學描述了復雜的量子系統如何隨時間演變并與其周圍環境相互作用。模擬量子動力學極其困難,但對于了解和預測材料的基本特性至關重要。這在開發 量子處理單元(QPUs) 中尤為重要,量子動力學模擬使 QPUs 開發者能夠了解其硬件的物理特性并改進其硬件。 量子動力學模擬與用于研究未來量子算法運行方式的主流電路模擬有所不同。電路模擬模擬了離散量子邏輯門應用下量子位的演變。這種簡化視圖將量子位與其周圍環境的交互方式進行了理想化,從而排除了對真實噪音和其他因素的考慮。相比之下,量子動力學模擬全面地反映了量子系統如何隨時間演變,揭示了量子過程的速度和準確性的基本限制。 為進行經典類比,可以使用應用于晶體管(抽象表示為 0 和 1)的二進制邏輯(AND、OR、XOR)對經典計算機的邏輯進行建模。然而,為了設計速度更快、性能更高的晶體管,電氣工程師需要運行能夠完全模擬設備物理特性的復雜模型,
Source
]]>
12020
-
NVIDIA 合作伙伴借助 AI 超級計算加速實現量子突破
http://www.open-lab.net/zh-cn/blog/nvidia-partners-accelerate-quantum-breakthroughs-with-ai-supercomputing/
Mon, 18 Nov 2024 06:20:45 +0000
http://www.open-lab.net/zh-cn/blog/?p=12008
Continued]]>
NVIDIA 的加速量子超級計算機 愿景是集成量子硬件和 AI 超級計算,將當今的量子處理器轉變為未來有用的量子計算設備。 在 超級計算 2024 (SC24) 上,NVIDIA 宣布了一系列與合作伙伴合作的項目,這些項目旨在推動量子生態系統應對當今技術和加速量子超級計算之間的挑戰。本文重點介紹了這些涵蓋量子硬件、算法和系統集成的項目。 生成式 AI 是解決量子計算所面臨挑戰的最具前景的工具之一。NVIDIA 與來自工業界和學術界的科學家合作,發布了新的評論研究論文 《Artificial Intelligence for Quantum Computing》,概述了 AI 將如何改變量子計算(圖 1)。 該論文聚焦于使用 GPT 模型合成量子電路和使用 transformers 解碼 QEC 代碼等主題,調查了在兩個最具變革性的計算領域交叉開展的關鍵工作。
Source
]]>
12008
-
利用 NVIDIA CUDA-Q 和 NVIDIA cuDNN 加速太陽能預測的量子算法實現
http://www.open-lab.net/zh-cn/blog/accelerating-quantum-algorithms-for-solar-energy-prediction-with-nvidia-cuda-q-and-nvidia-cudnn/
Wed, 23 Oct 2024 05:24:37 +0000
http://www.open-lab.net/zh-cn/blog/?p=11697
Continued]]>
改善可持續能源的來源是一個全球性問題,具有環境和經濟安全方面的影響。臺灣中原基督教大學電力系統與能源杰出教授 Ying-Yi Hong 研究混合量子經典方法,這些方法利用 量子計算 來解決電力系統和可持續能源方面的挑戰性問題。 Hong 教授的研究團隊重點關注太陽輻射預測,目標是利用地理和歷史數據來預測光伏發電場的發電量,使電力公司能夠以最佳方式調度傳統的基于礦物燃料的發電。 Hong 教授和他的學生 Dylan Lopez 使用 NVIDIA CUDA-Q 平臺 ,通過混合量子神經網絡(HQNN)運行的計算來預測太陽輻射。這項工作最近發表在論文《 使用混合量子神經網絡進行太陽輻射預測:GPU-Based Workflow 開發平臺的比較 》中。 與其他領先的量子模擬器相比,HQNN 的這項工作利用了 CUDA-Q 與 NVIDIA cuDNN 庫的互操作性,
Source
]]>
11697
-
利用 NVIDIA GPU 實現量子動力學系統模擬
http://www.open-lab.net/zh-cn/blog/simulating-quantum-dynamics-systems-with-nvidia-gpus/
Wed, 16 Oct 2024 06:45:28 +0000
http://www.open-lab.net/zh-cn/blog/?p=11721
Continued]]>
量子動力學描述了遵守量子力學定律的物體如何與其周圍環境相互作用,從而實現對物質行為的預測。準確的量子動力學模擬為新材料、太陽能電池、電池、傳感器和許多其他尖端技術的開發提供信息。它們也是設計和構建有用的 量子計算機 (包括設計新型量子位、提高門保真度和執行設備校準)的關鍵工具。 在實踐中,模擬量子系統極具挑戰性。動力學模擬的標準步驟包括準備量子態,在時間上演變,然后測量系統的某些屬性,例如系統的平均能量或其能量級別之間的過渡概率。在實踐中,這意味著要解決由薛定方程或林布萊德主方程控制的微分方程。多體量子系統由指數級大的希爾伯特空間表示,這使得傳統模擬方法難以解決精確解。 為了克服這個問題,我們使用了巧妙的近似值和數值方法。我們面臨的挑戰是找到計算效率較高的近似值方法,同時保持較高的準確性。像張量網絡這樣的技術可以高效計算大規模量子系統的動力學,但難以處理高度糾結的系統。
Source
]]>
11721
-
利用 GPT 推進量子算法設計
http://www.open-lab.net/zh-cn/blog/advancing-quantum-algorithm-design-with-gpt/
Mon, 30 Sep 2024 09:19:55 +0000
http://www.open-lab.net/zh-cn/blog/?p=11498
Continued]]>
大語言模型(LLMs)等 AI 技術正在迅速改變許多科學學科。 量子計算 也不例外。NVIDIA、多倫多大學和圣猶達兒童研究醫院攜手合作,將生成式預訓練變壓器(GPTs)引入 新量子算法的設計中 ,包括 生成式量子特征求解器(GQE)技術 。 GQE 技術是 AI for Quantum 技術浪潮中的新技術。由 NVIDIA CUDA-Q 平臺開發,GQE 是第一種使用自己的 GPT 模型創建復雜量子電路的方法。 CUDA-Q 平臺在開發 GQE 方面發揮了重要作用。在量子計算中訓練和使用 GPT 模型需要對 CPU、GPU 和 QPU 進行混合訪問。CUDA-Q 專注于 加速量子超級計算 ,這使其成為完全混合計算環境,非常適合 GQE。 據 GQE 聯合作者 Alan Aspuru-Guzik 稱,這些能力將 CUDA-Q 定位為可擴展的標準。
Source
]]>
11498
-
CUDA-Q 支持量子聚類算法的資源縮減
http://www.open-lab.net/zh-cn/blog/cuda-q-enabled-resource-reduction-for-quantum-clustering-algorithms/
Mon, 26 Aug 2024 07:44:58 +0000
http://www.open-lab.net/zh-cn/blog/?p=11112
Continued]]>
量子計算機可以利用疊加、糾結和干擾的量子屬性,從數據中推廣學習和見解。這種量子機器學習(QML)技術最終將在量子加速超級計算機上運行,這些計算機結合了CPU、GPU和QPU的處理能力,以解決世界上一些最復雜的問題。 許多 QML 算法提供了理論加速,假設經典數據可以使用所謂的 Quantum Random Access Memory (QRAM) 在疊加中高效加載。缺乏任何高效的方法來實現 QRAM 意味著早期的量子計算機可能會擅長計算,而不是數據密集型任務 在實踐中,在近期和中期硬件上有效的 QML 算法必須專注于計算密集型啟發式算法,以便在沒有 QRAM 的情況下分析數據。 本文重點介紹了副教授 Dr. Petros Wallden 及其團隊在 Quantum Software Lab(愛丁堡大學信息學學院的一部分)的近期研究。Dr.
Source
]]>
11112
-
借助 NVIDIA CUDA-Q v0.8 更輕松地進行高性能量子編程
http://www.open-lab.net/zh-cn/blog/performant-quantum-programming-even-easier-with-nvidia-cuda-q-v0-8/
Thu, 08 Aug 2024 02:31:13 +0000
http://www.open-lab.net/zh-cn/blog/?p=10890
Continued]]>
NVIDIA CUDA-Q(以前稱為 NVIDIA CUDA Quantum)是一個開源編程模型,用于構建充分利用 CPU、GPU 和 QPU 計算能力的混合量子經典應用程序。目前開發這些應用程序具有挑戰性,需要靈活、易于使用的編碼環境以及強大的量子模擬功能,以高效地評估和提高新算法的性能。 CUDA-Q 是專門為實現這一點而構建的平臺。它能夠在模擬和各種實際 QPU 硬件后端之間輕松切換,這使其成為量子應用開發的長期解決方案。最近的 v0.8 版本進一步提高了 CUDA-Q 模擬性能、開發者體驗和靈活性。 在本文中,我們將討論CUDA-Q v0.8: 量子態準備是有用的量子算法的核心組件,但它通常是最復雜、最昂貴的模擬元素之一。在內存中保留相同的狀態并對其進行重復使用,可以在使用不同參數的狀態多次或遵循經典的預處理和后處理步驟時優化模擬。
Source
]]>
10890
人人超碰97caoporen国产