Posts by Babak Hejazi
生成式人工智能/大語言模型
2025年 5月 1日
借助 NVIDIA cuBLAS 12.9 提高矩陣乘法速度和靈活性
NVIDIA CUDA-X 數學庫助力開發者為 AI、科學計算、數據處理等領域構建加速應用。
3 MIN READ
對話式人工智能
2024年 6月 12日
在 cuBLAS 中引入分組 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 庫版本 12.5 將繼續為深度學習(DL)和高性能計算(HPC)工作負載提供功能和性能。
2 MIN READ
對話式人工智能
2023年 2月 1日
NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩陣乘法性能
NVIDIA H100 TensorCore GPU 基于 NVIDIA Hopper 架構 和第四代 NVIDIA Tensor…
5 MIN READ