Yilin Fan

Yilin Fan 是 NVIDIA 的高級深度學習工程師,專注于 TensorRT/ TensorRT-LLM 性能。他對深度學習推理加速感興趣。加入 NVIDIA 之前,他曾在小馬智行工作,負責在自動駕駛汽車上優化/ 部署 DL 模型。Yilin 擁有卡內基梅隆大學軟件工程碩士學位和北京航空航天局學士學位。

Posts by Yilin Fan

數據中心/云端

Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用戶門檻

NVIDIA 的大語言模型 (LLM) 推理速度創下了世界紀錄。在包含 400 億參數的 Llama 4 Maverick 模型 (… 3 MIN READ