Shengliang Xu

Shengliang Xu 是 NVIDIA 算法模型優化團隊的高級深度學習工程師,專注于 NVIDIA GPU 平臺上深度學習模型推理的端到端優化。他的研究和開發興趣涵蓋大型語言模型和大型生成模型的模型和推理系統優化。Shengliang 擁有華盛頓大學計算機科學碩士學位,并退出了博士課程。他擁有上海交通大學計算機科學專業的另一個碩士學位和學士學位。

Posts by Shengliang Xu

數據中心/云端

NVIDIA Blackwell 平臺在 MLPerf Inference v4.1 中創下新的 LLM 推理記錄

大型語言模型 (LLM) 推理是一項全棧挑戰。實現高吞吐量、低延遲推理需要強大的 GPU、高帶寬 GPU 之間的互連、 4 MIN READ
數據中心/云端

NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理記錄

隨著生成式 AI 模型的持續創新,生成式 AI 在計算應用方面取得了巨大進步,從而大幅增強人類能力。這些模型包括 生成式 AI 模型, 3 MIN READ