Chenhan Yu

Chenhan Yu 是 NVIDIA 的工程經理,從事生成式 AI 和自動駕駛的推理和部署系統軟件優化。他擁有德克薩斯大學奧斯汀分校計算機科學博士學位。

Posts by Chenhan Yu

對話式人工智能

使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型優化器對 LLM 進行訓練后量化

隨著大語言模型(LLMs)的規模不斷擴大,提供易于使用且高效的部署路徑變得越來越重要,因為為此類 LLMs 提供服務的成本越來越高。 3 MIN READ