CUBLAS

2025年 6月 4日
NVIDIA Blackwell 在 MLPerf Training v5.0 中實現高達 2.6 倍的性能提升
創建先進的大語言模型 (LLM) 的過程始于預訓練過程。預訓練最先進的模型具有很高的計算要求,因為熱門的開放權重模型具有數百億到數千億個參數,
3 MIN READ

2025年 5月 1日
借助 NVIDIA cuBLAS 12.9 提高矩陣乘法速度和靈活性
NVIDIA CUDA-X 數學庫助力開發者為 AI、科學計算、數據處理等領域構建加速應用。
3 MIN READ

2025年 2月 4日
新的 AI 模型提供癌癥細胞級視圖
研究癌癥的研究人員推出了一種新的 AI 模型,該模型提供了癌細胞的細胞級映射和可視化,
1 MIN READ

2024年 12月 14日
Warp 1.5.0 引入圖塊化編程
借助最新版本的 Warp 1.5.0 ,開發者現在可以使用 Python 中基于圖塊的新編程基元。
5 MIN READ

2024年 11月 18日
使用 nvmath-python 實現 Epilog 運算與矩陣乘法的融合計算
nvmath-python (Beta) 是一個開源 Python 庫,為 Python 程序員提供對 NVIDIA CUDA-X…
4 MIN READ

2024年 6月 12日
在 cuBLAS 中引入分組 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 庫版本 12.5 將繼續為深度學習(DL)和高性能計算(HPC)工作負載提供功能和性能。
2 MIN READ

2023年 2月 1日
NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩陣乘法性能
NVIDIA H100 TensorCore GPU 基于 NVIDIA Hopper 架構 和第四代 NVIDIA Tensor…
5 MIN READ