NVIDIA ConnectX-8 SuperNIC 通過 PCIe6.0總線升級 AI 平臺架構

從?大語言模型 (LLM)?到?代理式 AI?推理和?物理 AI?，隨著 AI 工作負載的復雜性和規模不斷增加，人們對更快、擴展性更高的計算基礎設施的需求空前強烈。滿足這些需求就要從基礎開始重新思考系統架構。

NVIDIA 正在通過?NVIDIA ConnectX-8 SuperNIC?升級平臺架構。NVIDIA ConnectX-8 SuperNIC 是業內首款在單個設備中集成 PCIe6.0 交換機和超高速網絡的 SuperNIC。ConnectX-8 專為現代 AI 基礎架構設計，可提供更高的吞吐量，同時簡化系統設計，并提高能效和成本效益。

為 PCIe6.0 連接的時代做好準備

在基于 PCIe 連接的平臺中，尤其是配備 8 個或更多 GPU 的平臺，PCIe 交換機對于最大化 GPU 間通信帶寬和實現可擴展的 GPU 拓撲至關重要。現有設計依賴于獨立的 PCIe 交換機，這通常會增加設計復雜性，并可能會限制性能和效率。

ConnectX-8 通過內置的 PCIe6.0 交換機提供 48 通道的 PCIe6.0 連接解決了這一問題。將 GPU 到 GPU 和 GPU 到 NIC 通信整合到單一高性能設備中，消除了對獨立 PCIe 交換機的需求，減少了元器件數量并簡化了主板設計，為 AI 基礎設施打造了更具成本效益、可擴展的架構。

此外，憑借原生 PCIe6.0 支持，ConnectX-8 可滿足新一代 GPU、CPU 和 IO 加速器日益增長的 IO 需求。它使系統架構師能夠設計出向前兼容的平臺，能夠充分享用領先的高吞吐 PCIe6.0 設備的帶寬。

通過 NVIDIA RTX PRO 服務器加速企業工作負載

ConnectX-8 SuperNIC 現已全面投產。在 COMPUTEX 2025 上，ConnectX-8被發布用于全球各系統合作伙伴的?NVIDIA RTX PRO 服務器中

圖 1 比較了兩種服務器架構：采用獨立 PCIe 交換機的傳統設計，以及采用NVIDIA ConnectX-8 SuperNIC 集成 PCIe6.0 交換機的 NVIDIA RTX PRO 服務器的優化配置。

Side-by-side comparison of server designs: the traditional setup uses discrete PCIe switches to connect CPUs, GPUs, and NICs, while the optimized design uses ConnectX-8 SuperNICs that integrate PCIe switching and networking to directly connect CPUs and GPUs. — 圖 1. 傳統 (左) 和與采用*ConnectX-8 SuperNIC* 優化 (右) *服務器設計* *的比較*

在傳統設計中，服務器布局包括 2 個 CPU、8 個 GPU 和 5 個 NIC（包括 4 個 NVIDIA ConnectX-7 NIC 和 1 個?NVIDIA BlueField-3 DPU?）。這種配置還需要兩到四個獨立的 PCIe 交換機來實現 GPU 到 GPU 和 GPU 到 NIC 的連接，從而增加復雜性和組件數量。

在優化過的設計中，用ConnectX-8 SuperNIC 替換掉了專用 PCIe 交換機，將 PCIe6.0 交換和 800 Gb/s 網絡集成在了單一網卡設備中。

它使每個 GPU 的網絡帶寬翻倍，有助于消除 IO 瓶頸，并加快 GPU、NIC 和存儲之間的數據移動速度。因此，此 NVIDIA RTX PRO 服務器平臺可提供高達 2 倍的 NCCL all-to-all 性能，加速在多 GPU 和多節點工作負載中至關重要的集合通信，并提高 AI 工廠的可擴展性。

在圖 1的基礎上，圖 2 讓我們更深入地了解經過優化設計的服務器架構如何改善三種主要 GPU 通信路徑之間的連接：

GPU 到 GPU?通信跨越兩個 CPU 插座?：在傳統設計中，此路徑可能會遇到主機 CPU 和內部插座瓶頸問題，根據 CPU 之間鏈路的利用率不同，可能被限制在 25 GB/s 或更低的速度。相比之下，基于 ConnectX-8 的優化設計可為集群內的所有 GPU 間通信提供高達每個GPU 50 GB/s 的 IO 帶寬，因為 NCCL 直接通過網絡轉發所有流量。
GPU 到 NIC 通信：在?2：1 的 GPU 到 NIC 配置下，經過優化的架構為每個 GPU 提供 50 GB/s 的帶寬，無論 GPU 或主機系統是PCIe5.0 或PCIe6.0 。
GPU 到 GPU通信通過同一 PCIe 交換機?：相較PCIe5.0，，配備 PCIe6.0 的系統可將帶寬提高一倍，從而顯著加速同一 PCIe 交換機上的點對點 GPU 傳輸。

Side-by-side comparison of traditional and optimized server architectures. The traditional design (left) shows discrete PCIe switches connecting CPUs, GPUs, and NICs. The optimized design (right) features ConnectX-8 SuperNICs acting as both NICs and PCIe switches, streamlining connections across three GPU communication paths: GPU-to-GPU across CPU sockets, GPU-to-NIC, and GPU-to-GPU through the same PCIe switch. — 圖 2.傳統 (左) *和與采用* *ConnectX-8 SuperNIC的優化* (右) *服務器設計的比較，強調了三種關鍵的* *GPU* *通信路徑*

通過將 PCIe 交換直接集成到 SuperNIC 中，ConnectX-8 還簡化了主板設計、改善了氣流并增強了可維護性。這將打造一個更緊湊、更節能、更經濟高效的平臺。在 NVIDIA 參考設計的支持下，這項創新可幫助系統廠商更快地擴展其系統，并提高性能及降低 TCO。

基于 PCIe 總線的 AI 基礎架構的未來

NVIDIA ConnectX-8 正在重新定義基于 PCIe 總線的系統的可能性。通過將 PCIe6.0 交換機和高性能 SuperNIC 集成到單一集成設備中，ConnectX-8 可簡化服務器設計，減少組件數量，并解鎖現代 AI 工作負載所需的高帶寬通信路徑。從而打造更簡單、更節能的平臺，同時降低總體擁有成本 (TCO) 并實現出色的性能可擴展性。

此外，ConnectX-8 SuperNIC 還可在基于多 GPU 的平臺中實現增強的機密計算能力。

在?COMPUTEX 2025?上，領先的數據中心合作伙伴（展示了由內置 NVIDIA ConnectX-8 SuperNIC 的NVIDIA RTX PRO 服務器所加速的先進 AI 平臺架構。

如需詳細了解?ConnectX-8 SuperNIC?在?NVIDIA Spectrum-X?平臺中的作用及其如何加速現代 AI 基礎設施，請參閱使用 NVIDIA SuperNIC 加速新一代 AI 網絡。

NVIDIA ConnectX-8 SuperNIC 通過 PCIe6.0總線升級 AI 平臺架構

為 PCIe6.0 連接的時代做好準備

通過 NVIDIA RTX PRO 服務器加速企業工作負載

基于 PCIe 總線的 AI 基礎架構的未來

相關資源

標簽

關于作者

NVIDIA ConnectX-8 SuperNIC 通過 PCIe6.0總線升級 AI 平臺架構

為 PCIe6.0 連接的時代做好準備

通過 NVIDIA RTX PRO 服務器加速企業工作負載

基于 PCIe 總線的 AI 基礎架構的未來

相關資源

標簽

關于作者

相關文章

NVIDIA SuperNIC 驅動新一代 AI 網絡發展

介紹 NVIDIA HGX H100 ：用于人工智能和高性能計算的加速服務器平臺

相關文章

NVIDIA Omniverse：開發者需要了解的關于遷移遠離啟動程序的重點

AI 分析護士觀察記錄以降低患者危險

在 NVIDIA Jetson 和 RTX 上運行 Google DeepMind 的 Gemma 3n

隆重推出 NVFP4，實現高效準確的低精度推理

NVIDIA Run:ai 和 Amazon SageMaker HyperPod 攜手簡化復雜 AI 訓練管理