Yiheng Zhang

Yiheng Zhang 是 NVIDIA TensorRT 團隊的軟件工程師,專注于 MLPerf 推理。億恒擁有自動駕駛軟件、 Jetson 平臺軟件優化和 MLPerf 推理通用性能優化方面的經驗。 Yiheng 擁有斯坦福大學計算機科學碩士學位。

Posts by Yiheng Zhang

內容創建/渲染

NVIDIA TensorRT 解鎖 NVIDIA Blackwell GeForce RTX 50 系列 GPU 的 FP4 圖像生成

NVIDIA Blackwell 平臺的推出開啟了生成式 AI 技術進步的新時代。其最前沿是新推出的 GeForce RTX 50 系列… 4 MIN READ
數據中心/云端

NVIDIA Blackwell 平臺在 MLPerf Inference v4.1 中創下新的 LLM 推理記錄

大型語言模型 (LLM) 推理是一項全棧挑戰。實現高吞吐量、低延遲推理需要強大的 GPU、高帶寬 GPU 之間的互連、 4 MIN READ
數據中心/云端

NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理記錄

隨著生成式 AI 模型的持續創新,生成式 AI 在計算應用方面取得了巨大進步,從而大幅增強人類能力。這些模型包括 生成式 AI 模型, 3 MIN READ
數據中心/云端

NVIDIA GH200 Grace Hopper 超級芯片首次亮相,取得領先的 MLPerf 推理 v3.1 結果

人工智能正在改變計算方式,推動AI在全球范圍內的應用部署。智能聊天機器人、圖像和視頻合成的簡單文本提示、 4 MIN READ
數據中心/云端/邊緣

通過 AI 的全棧優化在 MLPerf 推理 v3.0 中創下新紀錄

目前最令人興奮的計算應用程序依賴于在復雜的人工智能模型上進行訓練和運行推理,通常是在要求苛刻的實時部署場景中。需要高性能、 5 MIN READ