Jan Lasek

Jan Lasek 是 NVIDIA 的高級深度學習算法工程師,專注于大語言模型和推薦系統。他參與的項目包括 MLPerf Training、NeMo 和 TensorRT Model Optimizer.他擁有華沙大學數學碩士學位和華沙工業大學計算機科學博士學位。

Posts by Jan Lasek

對話式人工智能

使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型優化器對 LLM 進行訓練后量化

隨著大語言模型(LLMs)的規模不斷擴大,提供易于使用且高效的部署路徑變得越來越重要,因為為此類 LLMs 提供服務的成本越來越高。 3 MIN READ