Lalit Vaidya

Lalit Vaidya 是 NVIDIA 的性能工程師。他專注于為推理和訓練提供基準數據。他擁有學士學位。來自太平洋大學的計算機科學專業。

Posts by Lalit Vaidya

生成式人工智能/大語言模型

使用 NVIDIA TensorRT-LLM 前瞻性解碼優化 Qwen2.5-Coder 吞吐量

專注于編碼的 大語言模型(LLMs) 已穩步應用于開發者工作流程。從配對編程到自我改進的 AI 智能體 ,這些模型可幫助開發者完成各種任務, 3 MIN READ
生成式人工智能/大語言模型

借助 NVIDIA TensorRT-LLM 預測解碼,將 Llama 3.3 的推理吞吐量提升 3 倍

隨著近期新增的 Llama 3.3 70B (一種純文本指令調整模型),Meta 的開放 大語言模型 (LLMs) 集合將繼續增長。 4 MIN READ