現代高性能計算 (HPC) 實現的不僅僅是快速計算,它還為正在解鎖科學突破的 AI 系統提供支持。
HPC 已經經歷了多次迭代,每次迭代都因技術的創造性再利用而引發。例如,早期的超級計算機使用現成的組件。后來,研究人員利用個人計算機構建了強大的集群,甚至還調整了游戲 graphics cards 以用于科學工作。
當今的 HPC 系統(許多由 NVIDIA 加速計算提供支持)專為速度而設計。今天在 ISC 2025 上公布的最新全球超級計算機 TOP500 榜單強調了這一點,其中 77% 的系統由 NVIDIA 提供支持。
與此同時,Tensor Core 等創新功能可為矩陣乘法等常見運算提供更快的計算速度,并且混合精度 (一種結合多個浮點精度格式的技術,詳情見下文) 等技術的越來越多的使用正在提高性能和能效,從而推動氣候科學和醫學等領域的飛躍。
NVIDIA 為 TOP500 的領導者提供支持
NVIDIA 繼續引領超級計算領域,為最新 TOP500 榜單中的 381 個系統提供支持。其中包括前 10 名 (Jülich Supercomputing Centre 的 JUPITER 超級計算機) 的新條目,該超級計算機在第 4 位首次亮相。
TOP500 中排名前 100 的系統中,有 83 個現在使用 accelerated computing 相比之下,只有 17 個僅使用 CPU。
此外,最新 Green500 全球最節能 FP64 超級計算機榜單中的前兩個系統由 NVIDIA GH200 Grace Hopper 超級芯片提供支持,前 10 中的 9 個由 NVIDIA 提供加速。
適用于科學領域的 Tensor Core
AI 性能不僅僅來自于浮點運算量的增加。它越來越植根于硬件與軟件的融合,例如通過使用 Tensor Cores。
Tensor Core 是 NVIDIA GPU 內部的高級組件,旨在加速矩陣運算,這是 AI 和深度學習背后的核心計算。通過更高效地處理復雜的計算,它們可以加速模型訓練和推理等流程。
Tensor Core 可加快常見矩陣運算的計算速度,尤其是當組織轉向較低精度 (例如 FP8) 進行模型訓練時,在保持準確性的同時,精度每降低一步,吞吐量幾乎翻倍。目前,仿真工作負載中只有某些操作可以利用 Tensor Core。這些操作通常只占總運行時的一小部分,很少對整體交付性能產生影響。
隨著 GPU 上越來越多的物理空間專用于為 AI 構建的低精度 Tensor Cores,這為 HPC 社區提供了再次重復利用硬件以推進科學發現的機會。
為此,NVIDIA 正在投資新方法,將 Tensor Cores 用于更多與科學模擬相關的用例。
RIKEN 計算科學中心的 Yuki Uchino 和芝浦工業大學的 Katsuhisa Ozaki 教授發表了一篇論文,展示了 GPU 中的整數單元如何使用 Tensor Cores 中的整數矩陣乘法加速器和一種名為 Ozaki 方案的算法來實現包括 FP64 在內的任意精度。
受此計劃的啟發,NVIDIA 正在開發使用更多 GPU Tensor Core 加速高精度張量和矩陣計算的庫,重點是提高準確性、性能和能效。
使用這些庫已經展示出一些驚人的優勢:與使用 FP64 硬件相比,使用這些庫時,包含大約 1000 個原子的硅模擬在紫外線照射下的運行速度快 1.8 倍,同時提供相同的結果,節省了時間和能源。

在這些新庫的幫助下,BerkeleyGW 等常見 HPC 仿真很快將能夠利用較低精度的 Tensor Cores,實現性能和能效的飛躍。
AI 超級計算推動科學發展
雖然 TOP500 榜單突出了當今超級計算機的高精度速度,但并沒有說明它們如何通過混合精度和 AI 為科學發現提供動力支持。
去年,諾貝爾化學獎和物理學獎得主 Demis Hassabis 和 John Jumper 等使用 AI 的研究人員因其在 Google DeepMind 的 AlphaFold 蛋白質結構預測模型方面的工作而獲獎,多倫多大學名譽教授 Geoff Hinton 和普林斯頓大學名譽教授 John Hopfield 因其在推動神經網絡的發展方面取得的突出成就而獲獎。
著名的高性能計算 Gordon Bell Prize 還授予了 KAUST 的 David Keyes 團隊,他們使用混合精度方法模擬了龐大的 ERA5 氣候數據集,該數據集每小時提供過去 80 年大氣、地表和海洋波浪變量的估算數據,其中從地表到 80 公里高度的高度為 137 個高度。
混合精度是一種結合多種浮點精度格式的技術。使用較低精度的數據類型可以提高性能和效率,使應用程序能夠在提高性能的同時使用更少的資源。
隨著科學家構建新的 AI 模型來加速科學工作流程,mixed precision 在科學領域的使用正變得越來越普遍。
在英國,布里斯托爾大學的 Isambard-AI 系統由 NVIDIA Grace Hopper 提供支持,使用混合精度訓練 Nightingale AI 等模型。
Nightingale AI 由 Prof Aldo Faisal 領導開發,是一個用于醫療健康和生物醫學研究的多模態基礎模型,整合了成像、心臟病學和電子健康記錄。與其他醫療健康大語言模型不同,Nightingale AI 不僅使用基于文本的推理,還利用成像模式和標準診斷技術,使用大量患者數據來提供醫學見解。Nightingale AI 的目標是作為其他醫療健康應用的基礎,包括醫生辦公室助理和遠程醫療分診系統。
Isambard-AI 使用混合精度實現了訓練 Nightingale AI 等多模態 LLM 所需的大規模和精確度,而無需使用過多的硬件進行訓練或推理。
邁向下一次 HPC 迭代
加速計算、先進Tensor技術和混合精度方法的結合正在改變計算科學,展現出實現更多 AI 突破的潛力。
隨著 JUPITER 等系統加入 TOP500,將 AI 用于科學目的 (例如 Isambard-AI) 的新興工作以及 Ozaki 仿真方法等創新,加速 Tensor Core 性能以執行高精度任務,一個新時代正在出現。
通過一些衡量標準,超級計算機(Supercomputers)將繼續提速,但僅憑速度是不夠的。要對重要的科學問題找到新的見解,將取決于智能、靈活的方法,在不影響科學嚴謹性的情況下加速發現,以滿足科學和高性能計算(HPC)社區乃至世界的需求。
加入我們的 ISC
我們很高興在 ISC 2025 上公布 AI 和高性能計算 (HPC) 的新突破。
歡迎參觀 NVIDIA 的 E30 展位,親身了解我們在技術領域的最新進展如何加速發現和可持續發展。