Daniel Glogowski – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 17 Jun 2025 08:53:36 +0000
zh-CN
hourly
1
196178272 -
利用 NVIDIA Data Flywheel Blueprint 通過模型蒸餾構建高效的 AI 智能體
http://www.open-lab.net/zh-cn/blog/build-efficient-ai-agents-through-model-distillation-with-nvidias-data-flywheel-blueprint/
Wed, 11 Jun 2025 08:48:06 +0000
http://www.open-lab.net/zh-cn/blog/?p=14291
Continued]]>
隨著企業加速采用代理式 AI,團隊在擴展智能應用程序的同時管理推理成本方面面臨著越來越大的挑戰。大語言模型 (LLM) 提供強大的性能,但會產生巨大的計算需求,通常會導致高延遲和高成本。 與此同時,許多開發工作流程(例如評估、數據管理和微調)在很大程度上仍是手動操作。這些流程非常耗時,難以自動化,并且無法有效擴展。 更復雜的是,AI 智能體越來越依賴多個專業模型來執行推理、工具路由和摘要等任務。每個組件都有不同的性能特征和優化要求,因此很難大規模地單獨評估和調整它們。 為解決這一問題,NVIDIA 推出了用于構建數據飛輪的 NVIDIA AI Blueprint,這是一種基于 NVIDIA NeMo 微服務構建的參考架構。借助該藍圖,團隊能夠利用來自 AI 智能體交互的真實生產流量,在不影響準確性的情況下,將 LLM 持續轉換為更小、更便宜、更快速的模型。它自動執行結構化實驗,
Source
]]>
14291
-
使用 NVIDIA NIM 構建基于 VLM 的簡單多模態信息檢索系統
http://www.open-lab.net/zh-cn/blog/building-a-simple-vlm-based-multimodal-information-retrieval-system-with-nvidia-nim/
Wed, 26 Feb 2025 06:30:18 +0000
http://www.open-lab.net/zh-cn/blog/?p=13023
Continued]]>
在當今數據驅動的世界中,即使是從少量數據中檢索準確信息的能力,對于尋求精簡、有效的快速部署、原型設計或實驗解決方案的開發者來說也至關重要。信息檢索領域的主要挑戰之一是管理非結構化數據集中的各種模式,包括文本、PDF、圖像、表格、音頻、視頻等。 多模態 AI 模型通過同時處理多個數據模式來應對這一挑戰,以不同的形式生成連貫一致的全面輸出。 NVIDIA NIM 微服務可簡化 AI 基礎模型 在語言、 計算機視覺 、語音、生物學等領域的安全可靠部署。 NIM 微服務可隨時隨地部署在 NVIDIA 加速基礎設施上,并提供行業標準 API,以快速集成應用和熱門 AI 開發框架 (包括 LangChain 和 LlamaIndex)。 本文將幫助您著手構建基于視覺語言模型(VLM)的多模態信息檢索系統,該系統能夠回答涉及文本、圖像和表格的復雜查詢。
Source
]]>
13023
人人超碰97caoporen国产