能源 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Tue, 17 Jun 2025 07:56:01 +0000 zh-CN hourly 1 196178272 使用 NVIDIA Nsight Profiler 簡化 EDF 流體動力學模擬的 GPU 移植 http://www.open-lab.net/zh-cn/blog/streamlining-gpu-porting-for-edfs-fluid-dynamics-simulations-with-nvidia-nsight-profilers/ Thu, 12 Jun 2025 07:52:36 +0000 http://www.open-lab.net/zh-cn/blog/?p=14254 Continued]]> 將現有 CPU 應用程序移植到 NVIDIA GPU 可以釋放性能提升,使用戶能夠以更大的規模和更快的速度解決問題。雖然修改代碼以實現 NVIDIA GPU 加速需要在初始階段投入時間和精力,但由此帶來的吞吐量和效率提升通常遠遠超過成本。 這樣的任務可能看起來令人生畏,并引起了人們的擔憂,因為他們會浪費時間,最終產生無法提供任何好處的半移植 CPU 代碼到 GPU 代碼。但是,將 CPU 代碼移植到 GPU 代碼可以逐步完成,從而實現即時加速并更大限度地降低風險。 在整個移植過程中,如果不需要先進的內核優化技術,將單個任務從 CPU 移植到 GPU 可提供顯著的加速和下游性能優勢,則經常會出現這種情況。 無論您是初學者還是資深 NVIDIA CUDA 開發者,NVIDIA Nsight 工具套件都支持整個移植流程。只需輕松設置 NVIDIA Nsight Systems,

Source

]]>
14254
使用 NVIDIA NeMo Curator 構建 Nemotron-CC:一個高質量萬億令牌數據集,用于大型語言模型預訓練,源自 Common Crawl http://www.open-lab.net/zh-cn/blog/building-nemotron-cc-a-high-quality-trillion-token-dataset-for-llm-pretraining-from-common-crawl-using-nvidia-nemo-curator/ Wed, 07 May 2025 06:32:25 +0000 http://www.open-lab.net/zh-cn/blog/?p=13827 Continued]]> 對于想要訓練先進的 大語言模型 (LLM) 的企業開發者而言,整理高質量的預訓練數據集至關重要。為了讓開發者能夠構建高度準確的 LLM,NVIDIA 之前發布了 Nemotron-CC ,這是一個價值 6.3 萬億個 token 的英語語言 Common Crawl (CC) 數據集。今天,NVIDIA NeMo Curator 團隊很高興地與大家分享,用于構建 Nemotron-CC 數據集的 pipeline 現已合并到 NeMo Curator GitHub 存儲庫 中。 Nemotron-CC 工作流現已集成到 NeMo Curator 中,為平衡大規模準確性和數據量之間的權衡提供了一種新穎的解決方案。Nemotron-CC 工作流結合使用分類器集成和合成數據重述,提供了一種可擴展的方法,可從原始數據集中生成高質量的合成數據,以擴展原始數據集。

Source

]]>
13827
聚焦:東京大學使用 NVIDIA Grace Hopper 進行開創性的節能地震研究 http://www.open-lab.net/zh-cn/blog/spotlight-university-of-tokyo-uses-nvidia-grace-hopper-for-groundbreaking-energy-efficient-seismic-research/ Thu, 20 Feb 2025 04:36:04 +0000 http://www.open-lab.net/zh-cn/blog/?p=12968 Continued]]> 超級計算機是推動突破性發現的引擎。從預測極端天氣到推進疾病研究,以及設計更安全、更高效的基礎設施,這些機器可以模擬因規模、成本和材料要求而無法在現實世界中進行測試的復雜系統。 自 1999 年推出 GPU 以來,NVIDIA 一直在不斷突破加速 計算的極限 ,這種方法使用專業硬件,通過在并行處理中捆綁頻繁出現的任務來大幅加速工作。這種效率使超級計算機能夠處理前所未有的計算挑戰,同時減少每項任務消耗的能源。 如今,由 NVIDIA 提供支持的系統在高效超級計算領域處于領先地位,在 Green500 榜單前 10 名中有 8 名入選,而 Green500 榜單是高效超級計算機的行業基準測試。德國于利希超級計算中心(Jülich Supercomputing Center)的 JEDI 系統由 NVIDIA Grace Hopper 提供動力支持,充分體現了這一進步,實現了 72.

Source

]]>
12968
聚焦:Stone Ridge Technology 利用 AWS 上的 NVIDIA PhysicsNeMo 加速油藏模擬工作流 http://www.open-lab.net/zh-cn/blog/spotlight-stone-ridge-technology-accelerates-reservoir-simulation-workflows-with-nvidia-modulus-on-aws/ Thu, 19 Dec 2024 09:18:06 +0000 http://www.open-lab.net/zh-cn/blog/?p=12486 Continued]]> 能源勘探中固有的風險和不確定性包括未知的地質參數、流體和巖石屬性的變化、邊界條件和噪聲觀測數據。嚴格校準關鍵油藏工程任務和現場優化的不確定性需要運行大量前向模擬。用例包括歷史記錄匹配、概率預測和反向問題。當與包含數十萬或數百萬個主動網格單元的高保真模型結合使用時,高性能計算 (HPC) 模擬器需要大量計算資源。 傳統上,代理或代理模型用于應對這些挑戰,因為它們能夠快速評估場景。許多現有的代理生成方法都針對特定場景,無法推廣到不同的問題。另一方面,全場代理模型在空間和時間上直接近似地求解油藏的主要或狀態變量,類似于全物理數值模擬器。 因此,可以將這些代理替換為完整的模擬器,并可用于應對各種挑戰。由于高計算要求和算法挑戰,為 3D 油藏生成全場代理仍然是一項挑戰。然而,生成完整字段代理的可行方法是結合使用先進的 ML 技術 (例如神經運算符、Neural Operators)、

Source

]]>
12486
聚焦:借助 AVEVA 動態模擬和 NVIDIA Raptor 推進自動駕駛操作 http://www.open-lab.net/zh-cn/blog/spotlight-advancing-autonomous-operations-with-aveva-dynamic-simulation-and-nvidia-raptor/ Thu, 21 Nov 2024 07:01:57 +0000 http://www.open-lab.net/zh-cn/blog/?p=12164 Continued]]> 工業工程師正在利用人工智能構建先進的流程模擬解決方案,并加快能源、電力和化學行業實現完全自主運營的進程。 融合人工智能的深度強化學習(DRL)代理正在幫助將傳統的工業自動化轉變為核心控制、現場和生產流程的工業自主。這是使用 智能體人工智能 進行高級推理和迭代規劃,旨在實現人類在循環中的目標,通過這種方式,能夠實現新的應用,例如高級工業控制、系統級自主和完全自主的工廠。 在本文中,我們將探討工業軟件領域的領導者 AVEVA 如何將其 Dynamic Simulation 平臺與 NVIDIA Raptor DRL 引擎集成,以最大限度地提高工業設備的產量、減少計劃外停機時間并提高產品質量。 傳統的高級控制技術 (例如高級過程控制或閉環實時優化) 非常適合可重復過程。當工廠條件相對穩定以優化能源消耗、排放和生產時,就會出現這種情況。然而,工業廠房會發生瞬變事件,

Source

]]>
12164
NVIDIA cuDSS 庫推動美國電網優化無障礙發展 http://www.open-lab.net/zh-cn/blog/nvidia-cudss-library-removes-barriers-to-optimizing-the-us-power-grid/ Tue, 19 Nov 2024 09:08:57 +0000 http://www.open-lab.net/zh-cn/blog/?p=12194 Continued]]> 隨著電力需求不斷增長,電網的電力系統優化(PSO)對于確保高效的資源管理、可持續性和能源安全至關重要。 東部互聯是北美的主要電網,由大約 70,000 個節點組成 (圖 1)。除了規模龐大之外,此類電網的優化還因災難性天氣事件和發電中斷等不確定性而變得復雜。 PSO 通常涉及解決大規模非線性優化問題,例如交變電流最優功率流(ACOPF)模型,這些模型通常包含數百萬個變量和約束。實時獲得準確的結果對于保持電網穩定性和效率至關重要,但這是一項極其困難的任務。 Sungho Shin 教授 (MIT)、François Pacaud 教授 (MINES Paris – PSL) 和博士后研究員 Alexis Montoison (ANL) 一直在開發非線性優化算法和求解器,這些算法和求解器使用 NVIDIA 工具來解決大規模 PSO 和其他復雜的非線性優化問題。

Source

]]>
12194
利用 NVIDIA CUDA-Q 和 NVIDIA cuDNN 加速太陽能預測的量子算法實現 http://www.open-lab.net/zh-cn/blog/accelerating-quantum-algorithms-for-solar-energy-prediction-with-nvidia-cuda-q-and-nvidia-cudnn/ Wed, 23 Oct 2024 05:24:37 +0000 http://www.open-lab.net/zh-cn/blog/?p=11697 Continued]]> 改善可持續能源的來源是一個全球性問題,具有環境和經濟安全方面的影響。臺灣中原基督教大學電力系統與能源杰出教授 Ying-Yi Hong 研究混合量子經典方法,這些方法利用 量子計算 來解決電力系統和可持續能源方面的挑戰性問題。 Hong 教授的研究團隊重點關注太陽輻射預測,目標是利用地理和歷史數據來預測光伏發電場的發電量,使電力公司能夠以最佳方式調度傳統的基于礦物燃料的發電。 Hong 教授和他的學生 Dylan Lopez 使用 NVIDIA CUDA-Q 平臺 ,通過混合量子神經網絡(HQNN)運行的計算來預測太陽輻射。這項工作最近發表在論文《 使用混合量子神經網絡進行太陽輻射預測:GPU-Based Workflow 開發平臺的比較 》中。 與其他領先的量子模擬器相比,HQNN 的這項工作利用了 CUDA-Q 與 NVIDIA cuDNN 庫的互操作性,

Source

]]>
11697
AI 加速電動汽車充電優化,實現規模化提速和成本節省 http://www.open-lab.net/zh-cn/blog/ai-research-revs-up-ev-charging-for-large-scale-optimization-speed-and-savings/ Mon, 14 Oct 2024 04:57:51 +0000 http://www.open-lab.net/zh-cn/blog/?p=11749 Continued]]> 電動汽車(EV)充電正在獲得一項創新的人工智能算法的推動,這項算法提高了效率,降低了成本,并防止電網在壓力下短路。 該實時智能解決方案 由加拿大皇家軍事學院(RMC)的研究團隊開發,優化了大型停車場的充電時間表,平衡快速充電和能源可用性。通過提高充電速度、成本和可用性,人工智能驅動的算法可以幫助為更廣泛地采用電動汽車鋪平道路,電動汽車是減少排放和實現氣候目標的更清潔選擇。 RMC 電氣和計算機工程系教授 Vincent Roberge 表示:“在智能停車場中優化電動汽車的充電時間表,不僅會對消費者產生巨大的影響,因為他們最終會支付更低的價格,而且會在用電量充足時對環境產生巨大的影響。” 電動汽車的普及程度與日俱增,而汽車充電站的可用性則是其中的一個主要缺陷。預測和管理該技術對電網的依賴對于保持駕駛員滿意度和能源基礎設施穩定至關重要。這一點在大型停車場尤為重要,

Source

]]>
11749
NVIDIA Grace CPU 實現全球頂級數據中心性能和突破性能效優勢 http://www.open-lab.net/zh-cn/blog/nvidia-grace-cpu-delivers-world-class-data-center-performance-and-breakthrough-energy-efficiency/ Wed, 09 Oct 2024 05:11:03 +0000 http://www.open-lab.net/zh-cn/blog/?p=11758 Continued]]> NVIDIA 將 NVIDIA Grace CPU 設計為一種新型高性能數據中心 CPU,旨在提供突破性的 能效 ,并針對數據中心規模的性能進行了優化。 與傳統 CPU 計算相比,加速計算在性能和能效方面實現了巨大的飛躍。為了實現這些加速,需要數據中心規模的全棧創新,涵蓋芯片、系統、軟件和算法。為適合的工作負載選擇合適的架構并提供出色的節能性能對于最大限度地提高數據中心的性能和最小化占用空間至關重要。 隨著工作負載的加速程度不斷提高,目前仍有一些用例主要在傳統 CPU 上運行,尤其是圖形分析等稀疏和“分支”序列化任務的代碼。與此同時,數據中心受到越來越多的電力限制,限制了其能力的增長。這意味著所有可以加速的工作負載都應該加速。那些無法加速的工作負載必須在盡可能高效的計算上運行,而 CPU 必須針對這些工作負載進行優化。

Source

]]>
11758
聚焦:Petrobras 利用 NVIDIA Grace CPU 加速用于油藏模擬的線性求解器 http://www.open-lab.net/zh-cn/blog/spotlight-petrobras-accelerates-linear-solvers-for-reservoir-simulation-using-nvidia-grace-cpu/ Tue, 24 Sep 2024 07:10:21 +0000 http://www.open-lab.net/zh-cn/blog/?p=11359 Continued]]> 油藏模擬通過模擬復雜場景并與真實的現場數據進行比較,幫助油藏工程師優化資源勘探方法。這擴展到對枯竭油藏的模擬,這些油藏可以重新用于運營中的碳存儲。油藏模擬對于旨在提高勘探和生產運營效率的能源公司至關重要。 本文展示了 NVIDIA Grace CPU 如何出色地解決此工作流程中的線性系統問題,與基于 x86 的替代 CPU 相比,Petrobras 實現了高達 4.5 倍的解決方案速度、4.3 倍的 能效 和 1.5 倍的可擴展性。 Petrobras 是一家領先的巴西能源公司,在轉向新能源的同時保持其核心油氣(O&G)勘探和生產業務。根據 Top500 和 Green500 榜單,Petrobras 擁有拉丁美洲最大的 HPC 基礎設施,由 NVIDIA 全棧加速計算平臺提供支持。他們的主要工作負載是地震處理和油藏模擬。 該公司率先推出了超深海勘探作業,

Source

]]>
11359
聚焦:SLB 與 NVIDIA 攜手推出能源領域生成式 AI 解決方案 http://www.open-lab.net/zh-cn/blog/spotlight-slb-and-nvidia-collaborate-on-gen-ai-solutions-for-energy/ Thu, 19 Sep 2024 07:39:30 +0000 http://www.open-lab.net/zh-cn/blog/?p=11371 Continued]]> 全球能源技術公司 SLB 宣布 ,在與 NVIDIA 的長期合作中,能源行業生成式 AI 解決方案的開發和擴展是一個新的里程碑。 這項合作加快了能源行業特定 生成式 AI 基礎模型 在 SLB 全球平臺(包括其 Delfi 數字平臺和 SLB 的新 Lumi 數據和 AI 平臺)上的開發和部署。這項工作利用 NVIDIA NeMo ( NVIDIA AI Enterprise 軟件平臺的一部分)開發可在數據中心、任何云或邊緣運行的自定義生成式 AI。 SLB 和 NVIDIA 正在合作構建和優化生成式 AI 模型,以滿足數據密集型能源行業(包括地下勘探、生產運營和數據管理)的特定需求和要求。這將有助于能源領域專家(包括研究人員、科學家、工程師和 IT 團隊)充分發揮生成式 AI 的潛力,使他們能夠以新的方式與復雜的技術流程進行交互,

Source

]]>
11371
聚焦:Shell 使用 NVIDIA PhysicsNeMo 將 CO2 存儲建模速度提高 100000 倍 http://www.open-lab.net/zh-cn/blog/spotlight-shell-accelerates-co2-storage-modeling-100000x-using-nvidia-modulus/ Mon, 09 Sep 2024 08:50:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=11302 Continued]]> 隨著世界在應對氣候變化方面的迫切需求,碳捕獲和存儲(CCS)已成為實現凈零排放的關鍵技術。CCS 技術包括從工業排放或通過直接空氣捕獲(DAC)捕獲二氧化碳(CO2),并將其安全地存儲在地下,可以推動需的脫碳策略,并幫助實現全球氣候目標。 CCS 技術的成功取決于對存儲點和注入方案的仔細選擇。準確預測長期(通常跨越數百年)的 CO2 plume 遷移和壓力累積對于確保存儲點的安全性和有效性至關重要。找到最佳設置需要在不同的地下條件、井位和注入速率下評估數萬種配置。但是,通常用于這些預測的傳統流量模擬器需要大量計算,因此限制了對潛在地點和注入方案的高吞吐量篩選。 為應對這些挑戰,Shell 正與 NVIDIA 合作,通過 NVIDIA PhysicsNeMo 利用尖端技術來提高 CCS 站點篩選流程的效率和準確性。 該項目利用機器學習(ML)模型實現了地下 CO2…

Source

]]>
11302
借助 NVIDIA Grace CPU 提升數學優化性能和能效 http://www.open-lab.net/zh-cn/blog/boosting-mathematical-optimization-performance-and-energy-efficiency-on-the-nvidia-grace-cpu/ Fri, 12 Jul 2024 05:38:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=10661 Continued]]> 數學優化是一種功能強大的工具,可以幫助企業和人們做出更明智的決策,并實現任意數量的目標。這些目標包括提高運營效率、降低成本和提高客戶滿意度。許多日常用例都可以應用數學優化,例如調度航班、定價酒店房間、選擇 GPS 路線和規劃貨運卡車路線等。 然而,數學優化計算需求很高。模型復雜性和數據集大小需要復雜的 AI 算法和高性能計算。由于對更快、更好的數學優化解決方案的需求不斷增長,從系統、軟件平臺到加速庫,全棧創新是必需的。 Gurobi 成立于 2008 年,是一家數學優化求解器,可解決復雜問題,并在數秒內向全球各行各業的 1200 多家客戶提供優化解決方案。該公司獲得了一臺基于 Supermicro NVIDIA MGX 的系統,由 NVIDIA GH200 Grace Hopper 超級芯片提供支持,該系統能夠以低功耗實現快速性能。

Source

]]>
10661
聚焦:西門子能源公司使用 NVIDIA PhysicsNeMo 將電網資產模擬加速 10000 倍 http://www.open-lab.net/zh-cn/blog/spotlight-siemens-energy-accelerates-power-grid-asset-simulation-10000x-using-nvidia-modulus/ Thu, 11 Jul 2024 06:05:06 +0000 http://www.open-lab.net/zh-cn/blog/?p=10676 Continued]]> 由于可再生能源發電量不斷增加、能源資源分散和重工業脫碳,世界能源系統變得越來越復雜和分布式。能源生產商面臨的挑戰是,在混合發電廠中優化運營效率和成本,這些廠同時生產可再生和碳基電力。電網運營商需要盡快地調度能源資源,以確保家庭和企業的電網可靠性和彈性。 Siemens Energy 使用 NVIDIA PhysicsNeMo 開發了 AI 代理模型,NVIDIA PhysicsNeMo 是一個開源框架,用于構建、訓練和微調物理信息機器學習 (Physics-ML) 模型。這些代理模型適用于復雜的工程系統,將為現代電網的工業數字孿生提供動力。這些系統包括電網中使用的襯套和氣體絕緣開關設備 (GIS)。襯套是一個關鍵的 Transformer 組件,是一種隔離結構,能夠幫助載流體通過接地水箱。 本文詳細介紹西門子能源公司如何構建其 AI 專業知識,

Source

]]>
10676
在 cuBLAS 中引入分組 GEMM API 以及更多性能更新 http://www.open-lab.net/zh-cn/blog/introducing-grouped-gemm-apis-in-cublas-and-more-performance-updates/ Wed, 12 Jun 2024 05:43:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=10332 Continued]]> 最新版本 NVIDIA cuBLAS 庫版本 12.5 將繼續為深度學習(DL)和高性能計算(HPC)工作負載提供功能和性能。本文將概述自版本 12.0以來 cuBLAS 矩陣乘法(matrix multiplications)中的以下更新: 分組的 GEMM API 可視為批量 API 的泛化,可在一次內核啟動中對不同的矩陣大小、轉置和縮放因子進行分組和并行化。 這種方法提供加速的一個示例是多專家 (MoE)模型的批量大小為 8 和 64,以及 FP16 輸入和輸出。在本示例中,分組的 GEMM API 可以使用批量 GEMM API 實現比單純循環快 1.2 倍的速度。 這一點令人印象深刻,因為當前分組的 GEMM 核函數僅利用線程束級 MMA 指令。它們已證明可以與利用線程束級 MMA (wgmma) 指令的分批 GEMM 核函數進行競爭。

Source

]]>
10332
人人超碰97caoporen国产