微服務 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Wed, 26 Mar 2025 06:15:06 +0000 zh-CN hourly 1 196178272 使用 NVIDIA NeMo 微服務和數據飛輪實現 AI 智能體性能最大化 http://www.open-lab.net/zh-cn/blog/maximize-ai-agent-performance-with-data-flywheels-using-nvidia-nemo-microservices/ Tue, 18 Mar 2025 06:10:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=13339 Continued]]> 隨著 代理式 AI 系統 的發展并成為優化業務流程的關鍵,開發者必須定期更新這些系統,以適應不斷變化的業務和用戶需求。通過 AI 和人類反饋不斷完善這些智能體,可確保它們保持有效性和相關性。 NVIDIA NeMo 微服務是一種完全加速的企業級解決方案,旨在簡化穩健數據飛輪的創建和維護,幫助 AI 代理保持適應性、高效率和最新狀態。 在本文中,我將全面介紹 NVIDIA NeMo 微服務,讓您深入了解其保持 AI 智能體以峰性能運行的關鍵功能。 與傳統系統不同,AI 智能體可以自主運行,推理復雜的場景,并在動態環境中做出決策。隨著這些系統的發展,企業開始構建 多智能體系統 ,其中 AI 智能體跨平臺集成并與人類團隊協作以增強運營,保持整個系統的更新以保持相關性和有效性變得越來越具有挑戰性。 解決方案在于采用 數據飛輪 策略,

Source

]]>
13339
構建生成式 AI OpenUSD 應用,呈現準確品牌的營銷視覺效果 http://www.open-lab.net/zh-cn/blog/building-a-generative-ai-openusd-app-for-brand-accurate-marketing-visuals/ Tue, 19 Nov 2024 09:38:22 +0000 http://www.open-lab.net/zh-cn/blog/?p=12205 Continued]]> 如今,品牌及其創意機構承受著巨大的壓力,需要大規模地創建和提供高質量、準確的產品圖片,從活動關鍵視覺效果到電子商務包裝截圖等。面向受眾的內容,如個性化和本地化視覺變化,增加了制作的復雜性。 制作成本、短時間線、資源和維護品牌身份都是營銷團隊創建更多資產和更具針對性的內容的重復障礙。 例如,意式特濃咖啡制造商可能希望在即將推出的產品中面向廣泛的受眾,從居住在城市的年輕專業人士到在鄉村享受退休生活的老一代。歷史上,這需要多個工作流程、地點、團隊和審查周期來執行,而這通常是不可能的,這會限制營銷團隊用于定位的可用內容。 為了大規模地為廣泛的受眾群體生成高質量、品牌準確的內容,創意團隊現在可以利用生成式 AI 工作流。將生成式 AI 集成到用于生成準確的視覺資產和制作內容的工具和應用中,可以為內容供應鏈帶來新的可能性和效率。 許多開發者已經在努力將其變為現實。 在本文中,

Source

]]>
12205
利用 NVIDIA AI Blueprint 搭建視頻搜索和摘要智能代理 http://www.open-lab.net/zh-cn/blog/build-a-video-search-and-summarization-agent-with-nvidia-ai-blueprint/ Mon, 04 Nov 2024 06:33:13 +0000 http://www.open-lab.net/zh-cn/blog/?p=11837 Continued]]> 本文最初于 2024 年 7 月 29 日發布,但已根據 NVIDIA AI Blueprint 信息進行了大量修改。 傳統的視頻分析應用及其開發工作流通常基于功能固定的、有限的模型構建,這些模型旨在僅檢測和識別一組預定義的對象。 借助 生成式 AI 、NVIDIA NIM 微服務和基礎模型,您現在可以使用更少的模型構建具有廣泛感知和豐富上下文理解的應用程序。 新型生成式 AI 模型,即視覺語言模型(VLM),為 視覺 AI 智能體 提供支持,這些智能體可以理解自然語言提示并執行視覺問答。通過結合 VLM、LLM 和最新的 Graph-RAG 技術,您可以構建功能強大的視覺 AI 智能體,從而實現對視頻的長篇理解。 這些可視化 AI 智能體將部署在工廠、倉庫、零售商店、機場、交叉路口等地。它們將幫助運營團隊利用從自然交互中生成的更豐富的見解做出更明智的決策。

Source

]]>
11837
NVIDIA 中構建 RAG 基問答大語言模型工作流程 http://www.open-lab.net/zh-cn/blog/creating-rag-based-question-and-answer-llm-workflows-at-nvidia/ Mon, 28 Oct 2024 05:35:37 +0000 http://www.open-lab.net/zh-cn/blog/?p=11785 Continued]]> 利用檢索增強生成(RAG)技術快速開發解決方案,助力問答 LLM 工作流程,由此催生出新型系統架構。NVIDIA 將 AI 用于內部運營,并在系統功能與用戶期望之間取得了多項重要發現。 我們發現,無論預期的范圍或用例如何,用戶通常都希望能夠執行非 RAG 任務,例如執行文檔翻譯、編輯電子郵件甚至編寫代碼。一個普通的 RAG 應用程序可能會這樣實現:對每個消息執行檢索管道,從而導致令牌的過度使用,并由于包含不相關的結果而導致不必要的延遲。 我們還發現,即使應用程序專為訪問內部私有數據而設計,用戶也非常喜歡訪問 Web 搜索和摘要功能。我們使用 Perplexity 的搜索 API 來滿足這一需求。 在本文中,我們分享了用于解決這些問題的基本架構,即使用路由和多源 RAG 生成能夠回答各種問題的聊天應用程序。這是我們已用于 NVIDIA 生產的應用程序的精簡版本,

Source

]]>
11785
人人超碰97caoporen国产