Supercomputing / Cluster – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 18 Mar 2025 19:48:17 +0000
zh-CN
hourly
1
196178272 -
基于物理的機器學習平臺 NVIDIA PhysicsNeMo 現已開源
http://www.open-lab.net/zh-cn/blog/physics-ml-platform-physicsnemo-is-now-open-source/
Thu, 23 Mar 2023 08:37:54 +0000
http://www.open-lab.net/zh-cn/blog/?p=6592
Continued]]>
基于物理的機器學習( Physics ML )正在轉型高性能計算( HPC )跨學科的模擬工作流程,包括計算流體動力學、結構力學和計算化學。由于其廣泛的應用,物理 ML 非常適合建模物理系統,并在從制造業到氣候科學的各個行業部署數字孿生。 NVIDIA PhysicsNeMo是一個最先進的物理 ML 平臺,它將物理與深度學習訓練數據相結合,以建立高保真、參數化的代理模型,并具有接近實時的延遲。使用 NVIDIA PhysicsNeMo 構建的代理模型有助于廣泛的解決方案,包括天氣預報,減少發電廠溫室氣體和加速清潔能源轉型. NVIDIA PhysicsNeMo 客戶的成功案例正在證明該平臺在各個行業中具有令人難以置信的實用性。然而,物理 ML 在深度學習領域是一個相對較新的領域,在研究層面和應用方面都面臨著重大挑戰。這是由于滿足物理 ML 規則所需的獨特要求:
Source
]]>
6592
-
NVIDIA HPC SDK v22.11 現已提供新的異步編程模型庫
http://www.open-lab.net/zh-cn/blog/new-asynchronous-programming-model-library-now-available-with-nvidia-hpc-sdk-v22-11/
Thu, 17 Nov 2022 11:06:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=5803
Continued]]>
為慶祝 SuperComputing 2022 國際會議, NVIDIA 宣布發布 HPC 軟件開發工具包( SDK ) v22.11 。 NVIDIA 開發者計劃 的成員可以免費 下載 。 NVIDIA HPC SDK 是一套面向高性能計算( HPC )開發人員的編譯器、庫和工具。它提供了開發人員高效開發高性能應用程序所需的一切。 HPC SDK 及其組件每年都會進行多次更新,包括新功能、性能提升和其他增強。 除了通常的修復和增強之外,新的 v22.1 版本還為您提供了一個創新的庫的預覽,該庫旨在標準化 C ++異步。該庫使開發人員能夠編寫不特定于 CPU 或 GPU 機器的高級算法代碼,從而提高了程序員的生產力和應用程序的可移植性。 庫引入了異步調度工作的能力,這導致了比現有 C ++并行算法更好的資源利用率和性能。這實現了細粒度的執行控制、最小化延遲,
Source
]]>
5803
-
用標準語言并行性開發加速代碼
http://www.open-lab.net/zh-cn/blog/developing-accelerated-code-with-standard-language-parallelism/
Wed, 12 Jan 2022 05:03:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2768
Continued]]>
NVIDIA 平臺是最成熟、最完整的加速計算平臺。在這篇文章中,我將介紹最簡單、最高效、最可移植的加速計算方法。有三種編程方法 GPU (圖 1 )。 CUDA C ++ Fortran 是 NVIDIA 可以展示新硬件和軟件創新的創新平臺,在這里,您可以調整應用程序以在 NVIDIA GPU 上實現最佳性能。許多開發人員認為這就是 NVIDIA 希望每個人為 GPU 編程的方式。 相反,我們預計,開發者首次來到NVIDIA 平臺將使用標準的并行編程語言,如 ISO C ++、 ISO Fortran 和 Python 。在這篇文章中,我強調了使用這種方法進行并行編程的一些成功,以證明進入NVIDIA CUDA 生態系統的最有成效的途徑。 NVIDIA 戰略的基礎是提供一套豐富、成熟的 SDK 和庫,在這些數據庫上可以構建應用程序。
Source
]]>
2768
-
使用 HPC SDK 21.11 (現已提供)最大限度地提高 HPC 應用程序的性能
http://www.open-lab.net/zh-cn/blog/maximize-performance-of-hpc-apps-with-hpc-sdk-21-11-available-now/
Mon, 13 Dec 2021 04:38:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2634
Continued]]>
在超級計算大會 (SC21) 上,NVIDIA 預先宣布了 HPC SDK 的下一次更新。今天,HPC SDK 21.11 版本發布給開發者計劃成員免費下載 高性能 NVIDIA SDK 是一套全面的編譯器和庫,用于高性能計算開發。它包括各種各樣的工具,這些工具被證明可以最大限度地提高開發人員的生產率,以及 HPC 應用程序的性能和可移植性。 HPC SDK 及其組件每年都會更新多次,包括新功能、性能提升和其他增強功能。 此 21.11 版本將包括對 HPC ++/ Fortran 編譯器支持和開發人員環境的更新,以及新的多節點多 GPU 庫功能。 …
Source
]]>
2634
-
使用 HPC SDK v21.11 最大限度地提高 HPC 應用程序的性能和可移植性
http://www.open-lab.net/zh-cn/blog/maximize-performance-and-portability-of-hpc-apps-with-hpc-sdk-v21-11/
Tue, 16 Nov 2021 06:52:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2377
Continued]]>
今天, NVIDIA 宣布了即將發布的 HPCSDK21 . 11 版本,其中包含新的庫增強功能。該軟件將在未來幾周內免費提供。 NVIDIA HPC SDK 是一套用于高性能計算開發的綜合編譯器和庫。它包括各種各樣的工具,這些工具被證明可以最大限度地提高開發人員的生產率,以及 HPC 應用程序的性能和可移植性。 HPC SDK 及其組件每年都會更新多次,包括新功能、性能提升和其他增強功能。 此 21 . 11 版本將包括對 HPC ++/ Fortran 編譯器支持和開發人員環境的更新,以及新的多節點 mulit GPU 庫功能。 NVFORTRAN 編譯器在去年的版本 20 . 11 中引入,它自動并行化使用 DO 并發標準語言功能編寫的代碼,如 此文章 中所述。 在 21 . 11 版中,程序員可以使用 ISO Fortran 標準當前工作草案中描述的…
Source
]]>
2377
-
NVIDIA 宣布推出 cuNumeric 公共 Alpha
http://www.open-lab.net/zh-cn/blog/nvidia-announces-availability-for-cunumeric-public-alpha/
Tue, 09 Nov 2021 10:00:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2197
Continued]]>
今天,英偉達宣布推出公開的 cuNumeric。這種替換庫 NumPy 的下降,將英偉達平臺上的分布式和加速計算引入到大型和不斷增長的 Python 社區和 PyDATA 生態系統中。 Python 已成為數據科學、機器學習和生產性數值計算中使用最廣泛的語言。 NumPy 是事實上的標準庫,提供了簡單易用的編程模型。該接口與科學應用的數學要求密切相關,使其成為許多最廣泛使用的數據科學和機器學習編程環境的基礎。 隨著數據集和程序的規模和復雜性不斷增加,人們越來越需要利用計算資源,這遠遠超出了單一 CPU 節點所能提供的功能。 cuNumeric 將 GPU 加速超級計算引入 NumPy 生態系統。下圖顯示了輕松擴展到 1000 GPU 秒以上的功能。 了解更多有關 cuNumeric 和 Legate 縮放技術的信息,
Source
]]>
2197
-
NVIDIA 宣布推出 cuQuantum 測試版、 Record Quantum Benchmark 和 Quantum Container
http://www.open-lab.net/zh-cn/blog/nvidia-announces-cuquantum-beta-availability-record-quantum-benchmark-and-quantum-container/
Tue, 09 Nov 2021 08:54:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2236
Continued]]>
量子計算( QC )將在眾多行業和領域推動新一輪的進步。在現有的計算機上模擬量子電路是未來量子計算技術發展到下一個階段的必要條件。 NVIDIA cuQuantum 是一個 SDK ,包含用于加速量子計算工作流的優化庫和工具。開發人員可以使用 cuQuantum ,同時更輕松、可靠地創建和驗證新算法。對于狀態向量和張量網絡方法,這可以將量子電路模擬的速度提高幾個數量級。 cuQuantum 使開發人員能夠更快地模擬更大的問題。 科學家、開發者和研究人員將會很高興聽到英偉達 CuQuyNDSDK 已經準備好進行公開測試。它與領先的量子計算框架集成, 可免費下載。 cuQuantum SDK 將成為量子電路模擬的基礎元素。早期的基準測試表明, cuQuantum 可以為量子研究人員提供數量級的加速,包括在多個量子算法上的世界級性能。
Source
]]>
2236
-
OpenAI 展示 GPT-3,一個 1750 億參數的語言模型
http://www.open-lab.net/zh-cn/blog/openai-presents-gpt-3-a-175-billion-parameters-language-model/
Tue, 07 Jul 2020 04:19:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4909
Continued]]>
OpenAI 研究人員最近發布了 研究報告 描述 GPT-3 ,一個由 1750 億個參數組成的最先進的語言模型。 相比之下,以前的版本 GPT-2 由 15 億個參數組成。微軟本月早些時候發布了最大的基于 Transformer 的語言模型,該模型由 170 億個參數組成。 “ GPT-3 在許多自然語言處理數據集上取得了很好的性能,包括翻譯、問答和完形填空任務,以及一些需要動態推理或領域調整的任務,如解譯單詞、在句子中使用新單詞或執行 3 位數算術,”研究人員在其研究報告中表示 紙張 “我們發現, GPT-3 可以生成新聞文章樣本,人類評估人員難以將其與人類撰寫的文章區分開來。” 自然語言處理任務從生成新聞文章、語言翻譯到回答標準化測試問題。 該組織表示:“每個模型的精確架構參數是基于計算效率和 GPU 模型布局中的負載平衡來選擇的。
Source
]]>
4909
人人超碰97caoporen国产