Deepak Unnikrishnan

Deepak Unnikrishnan 是 NVIDIA CUDA 性能團隊的高級軟件工程師。他擁有馬薩諸塞大學阿默斯特分校電氣和計算機工程博士學位。他的興趣是異構計算加速器系統的設計和性能優化。

Posts by Deepak Unnikrishnan

數據中心/云端

CUDA 12.1 支持大內核參數

CUDA 內核函數參數通過恒定存儲器傳遞給設備,并且被限制為 4096 字節。 CUDA 12.1… 2 MIN READ