<xmp id="om0om">

<td id="om0om"></td>

<table id="om0om"><noscript id="om0om"></noscript></table>

Zhihan Jiang

Jiang Zhihan Jiang 是 NVIDIA TensorRT 團隊的高級系統軟件工程師，專注于在 MLPerf 推斷中提供世界級的推理結果。在從事 MLPerf 工作之前，他從事 TensorRT 自主安全庫和基礎設施，以及 NVIDIA CPU 架構建模。 Zhihan 擁有斯坦福大學電氣工程碩士學位和佐治亞理工大學計算機工程學士學位。

Posts by Zhihan Jiang

數據中心/云端 2025年 4月 2日

NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍

在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下，大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時， 3 MIN READ

數據中心/云端 2024年 8月 28日

NVIDIA Blackwell 平臺在 MLPerf Inference v4.1 中創下新的 LLM 推理記錄

大型語言模型 (LLM) 推理是一項全棧挑戰。實現高吞吐量、低延遲推理需要強大的 GPU、高帶寬 GPU 之間的互連、 4 MIN READ

數據中心/云端 2024年 3月 27日

NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理記錄

隨著生成式 AI 模型的持續創新，生成式 AI 在計算應用方面取得了巨大進步，從而大幅增強人類能力。這些模型包括生成式 AI 模型， 3 MIN READ

數據中心/云端 2023年 9月 11日

NVIDIA GH200 Grace Hopper 超級芯片首次亮相，取得領先的 MLPerf 推理 v3.1 結果

人工智能正在改變計算方式，推動AI在全球范圍內的應用部署。智能聊天機器人、圖像和視頻合成的簡單文本提示、 4 MIN READ

數據中心/云端/邊緣 2023年 4月 5日

通過 AI 的全棧優化在 MLPerf 推理 v3.0 中創下新紀錄

目前最令人興奮的計算應用程序依賴于在復雜的人工智能模型上進行訓練和運行推理，通常是在要求苛刻的實時部署場景中。需要高性能、 5 MIN READ

計算機視覺/視頻分析 2022年 9月 8日

全棧創新為 NVIDIA 最高 MLPerf 推斷 2.1 結果提供燃料

如今，人工智能驅動的應用程序正在實現更豐富的體驗，這是由更大和更復雜的人工智能模型以及許多模型在管道中的應用所推動的。 4 MIN READ

人人超碰97caoporen国产