Roman Dubtsov

羅曼·杜布佐夫是 CUDA 數學圖書館的總工程師。 15 年來,他專注于高性能計算。他的特別興趣是加速矩陣乘法內核和硬件/軟件協同設計。

Posts by Roman Dubtsov

生成式人工智能/大語言模型

借助 NVIDIA cuBLAS 12.9 提高矩陣乘法速度和靈活性

NVIDIA CUDA-X 數學庫助力開發者為 AI、科學計算、數據處理等領域構建加速應用。 3 MIN READ
對話式人工智能

NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩陣乘法性能

NVIDIA H100 TensorCore GPU 基于 NVIDIA Hopper 架構 和第四代 NVIDIA Tensor… 5 MIN READ