Po-Han Huang

Po-Han Huang 是 NVIDIA 的深度學習軟件工程師,他花了六年多的時間通過 TensorRT 和 CUDA 優化加速經過訓練的深度神經網絡模型的推理。他擁有伊利諾伊大學厄巴納 - 香檳分校的電氣和計算機工程碩士學位。他的專業知識涵蓋深度學習加速、計算機視覺和 GPU 架構。

Posts by Po-Han Huang

數據中心/云端

Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用戶門檻

NVIDIA 的大語言模型 (LLM) 推理速度創下了世界紀錄。在包含 400 億參數的 Llama 4 Maverick 模型 (… 3 MIN READ