Posts by Matheen Raza
AI 平臺/部署
2025年 5月 21日
NVIDIA Dynamo 加速 llm-d 社區計劃,推動大規模分布式推理
在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。
1 MIN READ
AI 平臺/部署
2025年 4月 9日
借助 Rafay 為企業 AI 工作負載提供 NVIDIA 加速計算
生成式 AI 在全球的應用推動了全球對加速計算硬件的巨大需求。在企業中,這加快了加速私有云基礎設施的部署。在地區層面,
2 MIN READ
數據中心/云端
2024年 9月 30日
使用 NVIDIA NIM Operator 在 Kubernetes 上管理 AI 推理流程
NVIDIA NIM 微服務 是一套易于使用的云原生微服務,可縮短產品上市時間,并簡化生成式 AI 模型在云、數據中心、
2 MIN READ