Brian Pharris

Brian 是 NVIDIA 計算架構小組的首席架構師,他最近的工作重點是 GPU 加速的深度學習推理。他擁有麻省理工學院電氣工程和計算機科學學士和碩士學位。

Posts by Brian Pharris

生成式人工智能/大語言模型

NVSwitch 和 TensorRT-LLM MultiShot 共同加速 AllReduce 速度達 3 倍

在用戶數量可能在數百到數十萬之間波動,且輸入序列長度隨每個請求而變化的生產環境中,部署生成式 AI 工作負載會面臨獨特的挑戰。 1 MIN READ
計算機視覺/視頻分析

全棧創新為 NVIDIA 最高 MLPerf 推斷 2.1 結果提供燃料

如今,人工智能驅動的應用程序正在實現更豐富的體驗,這是由更大和更復雜的人工智能模型以及許多模型在管道中的應用所推動的。 4 MIN READ