Jun Yang

Jun Yang 是 NVIDIA 的高級工程總監,專注于 E2E AI 工作負載優化。目前,他正在領導 NVIDIA TensorRT-LLM 的整體工程工作。他擁有中國科學院計算技術研究所計算機架構碩士學位。

Posts by Jun Yang

數據中心/云端

NVIDIA Blackwell 平臺在 MLPerf Inference v4.1 中創下新的 LLM 推理記錄

大型語言模型 (LLM) 推理是一項全棧挑戰。實現高吞吐量、低延遲推理需要強大的 GPU、高帶寬 GPU 之間的互連、 4 MIN READ