Posts by Kamil Iskra
數據中心/云端
2025年 3月 13日
使用 NCCL 2.24 實現大規模網絡可靠性和可觀察性
NVIDIA 集合通信庫 (NCCL) 實現了針對 NVIDIA GPU 和網絡優化的多 GPU 和多節點 (MGMN) 通信基元。
3 MIN READ
數據中心/云端
2024年 9月 16日
借助 NVIDIA 集合通信庫實現顯存高效、快速初始化和成本估算優化 2.22
在過去幾個月中,NVIDIA 集合通信庫(NCCL)開發者一直在努力開發一系列新的庫功能和錯誤修復。在本文中,我們將討論 NCCL 2.22…
2 MIN READ