Posts by Vijay Thakkar
AI 平臺/部署
2025年 7月 16日
CUTLASS:基于張量和空間微核處理多維數據的原理抽象
在生成式 AI 時代,充分發揮 GPU 的潛力對于訓練更好的模型和大規模服務用戶至關重要。通常,
4 MIN READ
開發與優化
2025年 7月 16日
CUTLASS 3.x:用于 GEMM 內核設計的正交、可重用和組合抽象
GPU 上的 GEMM 優化是一個模塊化問題。高性能實現需要指定超參數,例如圖塊形狀、數學和復制指令以及線程束專用方案。
3 MIN READ
生成式人工智能/大語言模型
2024年 7月 11日
新一代的 FlashAttention
NVIDIA 很高興能與 Colfax、Together.ai、Meta 和普林斯頓大學合作,利用 Hopper GPU 架構和…
1 MIN READ