Posts by Brian Pharris
生成式人工智能/大語言模型
2024年 11月 1日
NVSwitch 和 TensorRT-LLM MultiShot 共同加速 AllReduce 速度達 3 倍
在用戶數量可能在數百到數十萬之間波動,且輸入序列長度隨每個請求而變化的生產環境中,部署生成式 AI 工作負載會面臨獨特的挑戰。
1 MIN READ
計算機視覺/視頻分析
2022年 9月 8日
全棧創新為 NVIDIA 最高 MLPerf 推斷 2.1 結果提供燃料
如今,人工智能驅動的應用程序正在實現更豐富的體驗,這是由更大和更復雜的人工智能模型以及許多模型在管道中的應用所推動的。
4 MIN READ