Xhoni Shollaj – NVIDIA 技術博客

如何使用 NVIDIA Llama Nemotron 模型通過推理增強 RAG 工作流

Mon, 04 Aug 2025 05:26:59 +0000

檢索增強生成 (RAG) 系統面臨的一大挑戰是處理缺乏明確清晰度或帶有隱含意圖的用戶查詢。用戶通常會以不準確的方式來表達問題。例如，考慮用戶查詢“告訴我 NVIDIA NeMo 模型訓練的最新更新”，用戶可能暗中對 NeMo 大語言模型 (LLM) 定制功能的進步感興趣，而不是其語音模型。然而，這種偏好沒有被明確表達，這可能會導致結果不理想。要克服這些限制并充分發揮 RAG 的真正潛力，就需要超越基本技術。本文介紹了 NVIDIA Nemotron LLM 的 AI 推理功能，這些功能顯著增強了 RAG 工作流。我們通過一個真實案例，展示了如何應用高級策略（例如查詢分析和重寫）來改進查詢引擎的搜索功能。 RAG 中的查詢重寫是將用戶的初始提示轉換為更優化的查詢以改進信息檢索的關鍵步驟。這一過程對于提高 RAG 性能至關重要，

Source

]]>

使用 NVIDIA NIM 和 LangChain 創建自定義 Slackbot LLM 智能體

Tue, 19 Nov 2024 08:59:27 +0000

在現代商業的動態世界中，通信和高效的工作流對成功至關重要，人工智能（AI）解決方案已經成為競爭優勢。 AI 智能體基于先進的大語言模型（LLM）構建，并由 NVIDIA NIM 提供支持，能夠以無縫方式提高工作效率和信息流。NIM 是 NVIDIA AI Enterprise 的一部分，是一套易于使用的微服務，旨在跨云、數據中心和工作站安全、可靠地部署高性能 AI 模型推理。通過利用 NIM 微服務的強大功能，企業可以利用 API Catalog 中的模型，快速構建超越簡單自動化的智能 Slackbot 。這表明 API Catalog 可用于生產部署。這些 Slackbot 成為寶貴的虛擬助手，能夠處理各種任務——從回答基本查詢到解決復雜問題，甚至生成創意內容。這不僅可以節省時間和資源，還可以打造更具協作性和高效的工作環境。在本文中，

Source

]]>