Harry Kim

Harry Kim 是 NVIDIA 的首席產品經理,通過 Triton 實現高性能和可擴展的 AI/ML 推理。他在 Meta 的推薦系統、Intel AI 的 AI 基礎架構以及 Google 的廣告排名和推薦系統方面擁有豐富的工作經驗。他擁有加州大學伯克利分校的統計學博士學位。

Posts by Harry Kim

AI 平臺/部署

NVIDIA Dynamo 加速 llm-d 社區計劃,推動大規模分布式推理

在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。 1 MIN READ
數據中心/云端

NVIDIA Dynamo 新增 GPU 自動縮放、Kubernetes 自動化和網絡優化功能

在 NVIDIA GTC 2025 上,我們宣布推出 NVIDIA Dynamo ,這是一種高吞吐量、低延遲的開源推理服務框架, 2 MIN READ
數據中心/云端

隆重推出 NVIDIA Dynamo:用于擴展推理AI模型的低延遲分布式推理框架

NVIDIA 今天在 GTC 2025 宣布發布 NVIDIA Dynamo 。NVIDIA Dynamo 是一個高吞吐量、 4 MIN READ
數據中心/云端

使用 NVIDIA GenAI-Perf 和 OpenAI 兼容 API 測量生成式 AI 模型性能

NVIDIA 提供 Perf Analyzer 和 Model Analyzer 等工具,幫助機器學習工程師測量和平衡延遲與吞吐量之間的權衡, 2 MIN READ