Keval Morabia

Keval Morabia 是 NVIDIA TensorRT Model Optimizer 團隊的高級深度學習工程師,專注于優化 LLM 的算法。更具體地說,Keval 從事剪枝、神經架構搜索和知識提煉等優化技術的研究,這些技術在過去顯著加快了 MLPerf 推理提交速度。Keval 加入 NVIDIA 后,他收購了 OmniML Inc.,并在那里擔任過早期的 ML 工程師。Keval 擁有伊利諾伊大學香檳分校計算機科學碩士學位,以及印度 BITS Pilani 分校計算機科學學士學位。

Posts by Keval Morabia

對話式人工智能

NVIDIA TensorRT 模型優化器 v0.15 提高推理性能擴展模型支持能力

NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型優化器,這是一種先進的模型優化技術量化工具包,包含量化、 2 MIN READ