Robin Kobus

Robin Kobus 是 NVIDIA 的高級 AI 開發者技術工程師。他的工作重點是優化 TensorRT-LLM 中的大語言模型推理。Robin 在德國 Mainz 的 Johannes Gutenberg 大學學習數學和計算機科學。在他的博士論文中,他研究了生物信息學算法在多 GPU 系統上的加速。

Posts by Robin Kobus

生成式人工智能/大語言模型

NVIDIA?TensorRT-LLM?現支持?Recurrent Drafting,實現?LLM?推理優化

Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術, 2 MIN READ