InfiniBand

2024年 11月 13日
NVIDIA Blackwell 在 MLPerf 訓練 v4.1 中將 LLM 訓練性能提高一倍
隨著模型規模的擴大以及使用更多數據進行訓練,它們的能力也隨之提升,實用性也隨之提升。為了快速訓練這些模型,需要在數據中心規模上提供更高的性能。
3 MIN READ

2024年 10月 25日
利用 NVIDIA SHARP 網絡計算提升系統性能
AI 和科學計算應用是分布式計算問題的絕佳示例。這些問題太大了,計算太密集,無法在單臺機器上運行。這些計算被分解為并行任務,
2 MIN READ

2024年 10月 15日
NVIDIA SuperNIC 驅動新一代 AI 網絡發展
在生成式 AI 時代,加速網絡對于為大規模分布式 AI 工作負載構建高性能計算結構至關重要。NVIDIA 在該領域繼續保持領先地位,
1 MIN READ

2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 實現跨平臺應用程序的可移植性和兼容性增強
NVSHMEM 是一個并行編程接口,可為 NVIDIA GPU 集群提供高效且可擴展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ

2024年 1月 23日
借助 NVIDIA Quantum InfiniBand 簡化 AI 網絡運營
一個常見的技術誤區是,性能和復雜性直接相關。也就是說,高性能的實現也是實現和管理最具挑戰性的。但是,在考慮數據中心網絡時,情況并非如此。
1 MIN READ

2023年 11月 14日
高性能計算的能效:平衡速度與可持續性
計算世界正處于巨變的邊緣。 對計算能力的需求,尤其是高性能計算 (HPC) 逐年增長,這也意味著能源消耗也在增長。然而,潛在的問題當然是,
4 MIN READ

2023年 10月 12日
適用于數據中心和 AI 時代的網絡
十多年來,傳統的云數據中心一直是計算基礎設施的基石,滿足了各種用戶和應用程序的需求。然而,近年來,
1 MIN READ

2023年 7月 6日
新的 MLPerf 推理網絡部門展示 NVIDIA InfiniBand 和 GPUDirect RDMA 功能
在 MLPerf Inference v3.0 中,NVIDIA 首次向新推出的 網絡分割 投入,
3 MIN READ

2023年 5月 25日
為網絡管理員導航生成式人工智能
我們都知道人工智能正在改變世界。對于網絡管理員來說,人工智能可以以一些驚人的方式改善日常運營: 然而,
1 MIN READ

2023年 5月 15日
使用 Alpa 和 Ray 在大型 GPU 集群中高效擴展 LLM 訓練
近年來,大型語言模型( LLM )的數量激增,它們超越了傳統的語言任務,擴展到生成式人工智能這包括像 ChatGPT 和 Stable…
4 MIN READ

2023年 4月 5日
通過 AI 的全棧優化在 MLPerf 推理 v3.0 中創下新紀錄
目前最令人興奮的計算應用程序依賴于在復雜的人工智能模型上進行訓練和運行推理,通常是在要求苛刻的實時部署場景中。需要高性能、
5 MIN READ

2022年 5月 19日
NVIDIA DGX A100 助力百圖生科構建獨特的生物計算引擎
本案例中通過 NVIDIA DGX A100 80GB 和 NVIDIA 網絡交換機,百圖生科構建了獨特的生物計算引擎,建立高質量、
1 MIN READ

2021年 11月 10日
宣布 NVIDIA Nsight Systems 2021 . 5
NVIDIA Nsight Systems 的最新更新 – 性能分析工具現在可下載 。此版本旨在幫助您跨 CPU 和 GPU 調整和擴展軟件,
2 MIN READ

2021年 11月 9日
使用 Magnum IO 加速云本機超級計算
超級計算機是一項重要的投資,但對于研究人員和科學家來說,它們是極其寶貴的工具。為了有效和安全地共享這些數據中心的計算能力,
2 MIN READ