Wenhan Tan

Wenhan Tan 是 NVIDIA 的解決方案架構師,協助客戶大規模采用 NVIDIA AI 解決方案。他的工作重點是加速深度學習應用以及應對推理和訓練挑戰。

Posts by Wenhan Tan

對話式人工智能

利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 實現 LLM 擴展

大語言模型 (LLMs) 已廣泛應用于聊天機器人、內容生成、摘要、分類、翻譯等領域。State-of-the-art LLMs 和基礎模型如… 5 MIN READ