]]>13672使用 NVIDIA NIM Operator 在 Kubernetes 上管理 AI 推理流程
http://www.open-lab.net/zh-cn/blog/managing-ai-inference-pipelines-on-kubernetes-with-nvidia-nim-operator/
Mon, 30 Sep 2024 09:15:08 +0000http://www.open-lab.net/zh-cn/blog/?p=11495Continued]]>NVIDIA NIM 微服務 是一套易于使用的云原生微服務,可縮短產品上市時間,并簡化生成式 AI 模型在云、數據中心、云和 NVIDIA GPU 加速工作站的部署,開發者對這些微服務表現出極大興趣。 為滿足不同用例的需求,NVIDIA 正在推出各種打包的 AI 模型作為 NVIDIA NIM 微服務,以在 生成式 AI 推理工作流 中啟用關鍵功能。 典型的生成式 AI 應用集成了多個不同的 NIM 微服務。例如,在 RAG 工作流中,多回合對話式 AI 使用 LLM、嵌入和重新排序 NIM 微服務。這些微服務的部署和生命周期管理及其對生產環境中的生成式 AI 工作流的依賴項可能會給 MLOps 和 LLMOps 工程師以及 Kubernetes 集群管理員帶來額外的工作量。 因此,NVIDIA 宣布推出 NVIDIA NIM Operator ,