網絡/通訊

2025年 7月 22日
了解 NCCL 調優以加速 GPU 之間的通信
NVIDIA 集合通信庫 (NCCL) 對于 AI 工作負載中的快速 GPU 到 GPU 通信至關重要,可使用各種優化和調優來提升性能。但是,
3 MIN READ

2025年 7月 18日
使用 Ansible 和 Git 實現 NVIDIA Air 網絡設計自動化
NVIDIA Air 的核心是實現自動化。您可以對網絡的每個部分進行編碼和版本控制,并將其設置為自動觸發。這包括創建拓撲、
2 MIN READ

2025年 7月 14日
NCCL 深度解析:跨數據中心通信與網絡拓撲感知
隨著 AI 訓練規模的擴大,單個數據中心 (DC) 不足以提供所需的計算能力。
2 MIN READ

2025年 7月 14日
借助 NCCL 2.27 實現快速推理和彈性訓練
隨著 AI 工作負載的擴展,快速可靠的 GPU 通信變得至關重要,這不僅適用于訓練,而且越來越適用于大規模推理。
3 MIN READ

2025年 7月 10日
InfiniBand 多層安全保護數據中心和 AI 工作負載
在當今數據驅動的世界中,安全性不僅僅是一項功能,更是基礎。隨著 AI、HPC 和超大規模云計算的指數級增長,
1 MIN READ

2025年 7月 7日
使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠
隨著 AI 借助代理式 AI 向規劃、研究和推理發展,工作流變得越來越復雜。為了高效部署代理式 AI 應用,AI 云需要軟件定義、
2 MIN READ

2025年 6月 25日
NVIDIA DOCA 3.0 助力 AI 平臺開啟網絡新紀元
NVIDIA DOCA 框架已發展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發布,
3 MIN READ

2025年 6月 18日
搶先體驗 NVIDIA GB200 系統如何幫助 LMarena 構建評估 LLM 的模型
在 NVIDIA 和 Nebius 的幫助下,加州大學伯克利分校的 LMArena 可以更輕松地了解哪些大語言模型在特定任務中表現出色。
2 MIN READ

2025年 6月 18日
NVIDIA 集合通信庫 2.26 實現性能和監控功能的提升
NVIDIA 集合通信庫 (NCCL) 可實現針對 NVIDIA GPU 和網絡優化的多 GPU 和多節點通信基元。
3 MIN READ

2025年 6月 2日
使用外部文件上傳在 NVIDIA Air 中構建可擴展且自定義網絡拓撲的優勢
NVIDIA Air 具有仿真從小型網絡到整個數據中心的任何網絡的獨特能力。在開始配置、路由或管理之前,請先考慮拓撲。
1 MIN READ

2025年 5月 30日
全球五大洲電信運營商正建立 NVIDIA 賦能的主權人工智能基礎設施
AI 正在成為各行各業創新的基石,將創造力和生產力提升到新的水平,并從根本上重塑我們的生活和工作方式。AI 工廠是一種新型基礎設施,
3 MIN READ

2025年 5月 18日
借助 NVIDIA ARC-Compact 在基站部署 AI-RAN
無線網絡是現代連接的支柱,通過全球數百萬個蜂窩基站為數十億 5G 用戶提供服務。AI-RAN 的機遇和優勢正在推動電信網絡和生態系統向 AI…
3 MIN READ

2025年 5月 18日
NVIDIA ConnectX-8 SuperNIC 通過 PCIe6.0總線升級 AI 平臺架構
從 大語言模型 (LLM) 到 代理式 AI 推理和 物理 AI ,隨著 AI 工作負載的復雜性和規模不斷增加,人們對更快、
2 MIN READ

2025年 5月 18日
借助 NVIDIA NVLink Fusion 將半定制計算平臺集成到機架級架構
為了高效應對 AI 工作負載,數據中心正在被重構。這是一項非常復雜的工作,因此,
2 MIN READ

2025年 5月 13日
使用 NVIDIA Air 服務將仿真與現實世界連接
NVIDIA Air 通過創建與真實數據中心基礎設施部署相同的副本來實現云規模效率。借助 NVIDIA Air,
1 MIN READ

2025年 4月 23日
NVIDIA Secure AI 正式發布
隨著許多企業開始對其數據進行 AI 訓練或推理,需要保護數據和代碼,尤其是大語言模型 (LLMs) 。由于數據敏感性,
1 MIN READ