Pradeep Ramani

Pradeep Ramani 是 NVIDIA 的高級深度學習架構師,致力于設計 GPU 上光速線性代數計算的抽象概念。Pradeep 擁有超過 14 年的 GPU 堆棧多層工作經驗,包括硬件設計、架構、編程模型和庫設計 (CUTLASS)。他獲得了理科碩士學位。電氣和計算機工程專業的博士生,來自加州大學圣巴巴拉分校 (University of California Santa Barbara)。

Posts by Pradeep Ramani

數據中心/云端

NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可編程性

矩陣乘法和注意力機制是現代 AI 工作負載的計算支柱。雖然庫如 NVIDIA cuDNN 提供高度優化的實現, 2 MIN READ