Posts by Chenjie Luo
對話式人工智能
2024年 9月 10日
使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型優化器對 LLM 進行訓練后量化
隨著大語言模型(LLMs)的規模不斷擴大,提供易于使用且高效的部署路徑變得越來越重要,因為為此類 LLMs 提供服務的成本越來越高。
3 MIN READ
生成式人工智能/大語言模型
2024年 5月 8日
NVIDIA TensorRT 模型優化器加速生成人工智能推理性能,現已公開
在快速發展的環境中,生成人工智能的發展對加速推理速度的需求仍然是一個緊迫的問題。隨著模型規模和復雜性的指數級增長,
3 MIN READ