Posts by Fred Oh
數據科學
2025年 1月 31日
CUDA 工具包現已支持 NVIDIA Blackwell 架構
CUDA 工具包 的最新版本 (版本 12.8) 使用最新的 NVIDIA CPU 和 GPU,持續提升數據科學、AI、
3 MIN READ
數據中心/云端
2025年 1月 31日
CUDA 運行時中的動態加載機制
過去,我們使用 等離線工具將 GPU 設備代碼與應用程序一起編譯。在這種情況下,GPU 設備代碼在 CUDA 運行時內部進行管理。然后,
3 MIN READ
數據中心/云端
2025年 1月 31日
NVIDIA 集合通信庫 2.23 促使新的縮放算法和初始化方法的誕生
NVIDIA 集合通信庫 (NCCL) 可實現針對 NVIDIA GPU 和網絡進行優化的多 GPU 和多節點通信基元。
2 MIN READ
數據中心/云端
2024年 9月 16日
借助 NVIDIA 集合通信庫實現顯存高效、快速初始化和成本估算優化 2.22
在過去幾個月中,NVIDIA 集合通信庫(NCCL)開發者一直在努力開發一系列新的庫功能和錯誤修復。在本文中,我們將討論 NCCL 2.22…
2 MIN READ
生成式人工智能/大語言模型
2024年 9月 11日
用于直線 CUDA 圖形和其他性能增強的恒定時間啟動
CUDA Graphs 是一種將 GPU 運算定義為圖形(而非一系列流啟動)并將其批量處理的方法。CUDA Graph 將一組 CUDA…
3 MIN READ
數據中心/云端
2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 實現跨平臺應用程序的可移植性和兼容性增強
NVSHMEM 是一個并行編程接口,可為 NVIDIA GPU 集群提供高效且可擴展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ