Sean Sodha – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Wed, 25 Jun 2025 04:24:38 +0000 zh-CN hourly 1 196178272 使用一個 GPU 運行多模態提取以實現更高效的 AI 工作流 http://www.open-lab.net/zh-cn/blog/run-multimodal-extraction-for-more-efficient-ai-pipelines-using-one-gpu/ Wed, 18 Jun 2025 04:20:36 +0000 http://www.open-lab.net/zh-cn/blog/?p=14361 Continued]]> 隨著企業生成和使用越來越多的多樣化數據,從 PDF 和演示文稿等多模態文檔中提取見解已成為一項重大挑戰。傳統的純文本提取和基本的檢索增強生成 (RAG) 流程存在缺陷,無法充分發揮這些復雜文檔的價值。結果如何?見解缺失、工作流程效率低下以及運營成本上升。 在本博文中,我們將通過使用 NVIDIA NeMo Retriever 微服務的代碼示例和一個 GPU,深入探討構建有效的多模態提取工作流的關鍵組件。 NeMo Retriever Retriever 是多模態文檔處理工作流的示例架構。它使用微服務從數百萬文檔的不同文件類型中高效提取信息。它與 NeMo Retriever 嵌入和重排序模型搭配使用,形成了完整的可擴展 RAG 解決方案,如適用于 RAG 的 NVIDIA AI Blueprint 所示 (如圖 1 所示) 。 在下一節中,

Source

]]>
14361
NVIDIA NeMo 檢索器將準確的多模態 PDF 數據提取速度提高 15 倍 http://www.open-lab.net/zh-cn/blog/nvidia-nemo-retriever-delivers-accurate-multimodal-pdf-data-extraction-15x-faster/ Tue, 18 Mar 2025 04:11:37 +0000 http://www.open-lab.net/zh-cn/blog/?p=13287 Continued]]> 企業生成和存儲的多模態數據比以往任何時候都多,但傳統的檢索系統在很大程度上仍然以文本為重點。雖然他們可以從書面內容中獲得見解,但不會提取嵌入表格、圖表和信息圖(通常是文檔中信息最密集的元素)的關鍵信息。 如果沒有多模態檢索系統, 檢索增強型生成(RAG) 用戶可能會丟失隱藏在這些復雜數據格式中的關鍵見解,從而在企業知識檢索中造成重大盲點。了解適用于 RAG 的 NVIDIA AI Blueprint 。 在本文中,我們將探索適用于 RAG 的 AI Blueprint 的最新進展,并深入探討背后的核心技術 – NVIDIA NeMo Retriever 。探索新的基準測試,了解 NVIDIA 合作伙伴如何使用此藍圖高效地提取、索引和查詢多模態數據。 適用于 RAG 的 AI Blueprint 是一個 GPU 加速的參考示例,

Source

]]>
13287
借助 NVIDIA NIM 智能體藍圖構建企業級多模態文檔檢索工作流 http://www.open-lab.net/zh-cn/blog/build-an-enterprise-scale-multimodal-document-retrieval-pipeline-with-nvidia-nim-agent-blueprint/ Wed, 28 Aug 2024 06:57:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=11088 Continued]]> 每年都會生成數萬億個 PDF 文件,每個文件可能由多個頁面組成,其中充滿了各種內容類型,包括文本、圖像、圖表和表格。這筆數據財富只能在人類能夠閱讀和理解的情況下才能快速使用。 但是,借助生成式 AI 和檢索增強生成(RAG),這些未開發的數據可以用于發現業務見解,從而幫助員工提高工作效率并降低成本。 想象一下,能夠準確地提取海量企業數據中包含的知識,有效地與數據對話,從而快速使您的數字人成為任何主題的專家。這反過來又使您的員工能夠更快地做出更明智的決策。 在本文中,我們將展示多模態 PDF 數據提取藍圖如何結合 NVIDIA NeMo Retriever 和 NVIDIA NIM 微服務,以及用于實現此目的的參考代碼和文檔。 PDF 是內容豐富的文檔,可存儲跨模式表達的精細信息,使其更加簡潔和易于理解。例如,PDF 可能包含用于傳達復雜信息的文本、表格、圖表、

Source

]]>
11088
人人超碰97caoporen国产