NeMo

2025年 7月 23日
PDF 數據提取方法及其在信息檢索中的應用
PDF 是共享財務報告、研究論文、技術文檔和營銷材料等信息的常用文件格式之一。然而,在構建有效的檢索增強生成 (RAG) 系統時,
4 MIN READ

2025年 7月 22日
使用 NVIDIA NeMo 在一個周末內訓練一個具備推理能力的 LLM
您是否曾想構建自己的推理模型,但認為它過于復雜或需要大量資源?再想想。借助 NVIDIA 強大的工具和數據集,
4 MIN READ

2025年 7月 21日
傳統 RAG 與代理 RAG——AI 智能體如何通過動態知識實現更高智能
是否曾依賴不知道新高速公路旁路或道路突然關閉的舊 GPS?它可能會讓您到達目的地,但不是最有效或最準確的方式。
1 MIN READ

2025年 7月 17日
使用 NVIDIA 安全配方保護代理式 AI 系統
隨著大語言模型 (LLM) 驅動更多能夠執行自主操作、工具使用和推理的代理式系統,企業被其靈活性和低推理成本所吸引。
2 MIN READ

2025年 7月 17日
黑客松獲獎者借助 NVIDIA NeMo Agent Toolkit 讓代理式 AI 如生
學習新工具包的最佳方式是構建一些真實的東西,這正是開發者在最近的 NVIDIA NeMo Agent 工具包黑客松上所做的。在兩周的時間里,
1 MIN READ

2025年 7月 9日
使用 NVIDIA NeMo-RL 進行強化學習:通過 GRPO 復制 DeepScaleR 配方
強化學習 (RL) 是交互式 AI 的支柱。它對于教導智能體推理和從人類偏好中學習、實現多輪工具使用等至關重要。
2 MIN READ

2025年 7月 3日
新視頻:使用 NVIDIA Data Flywheel Blueprint 構建可自我提升的 AI 代理
由大語言模型驅動的 AI 智能體正在改變企業工作流,但高昂的推理成本和延遲可能會限制其可擴展性和用戶體驗。為解決這一問題,
1 MIN READ

2025年 6月 30日
出色的多模態 RAG:Llama 3.2 NeMo 檢索器嵌入模型如何提高工作流準確性
數據遠不止于文本,它本質上是多模態的,包括圖像、視頻、音頻等,通常采用復雜的非結構化格式。雖然常見的方法是將 PDF、掃描圖像、
2 MIN READ

2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上運行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 現已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上個月,
1 MIN READ

2025年 6月 25日
如何使用 NVIDIA NeMo 技能簡化復雜的 LLM 工作流程
改進 LLM 的典型方法涉及多個階段:合成數據生成 (SDG) 、通過監督式微調 (SFT) 或強化學習 (RL) 進行模型訓練以及模型評估。
4 MIN READ

2025年 6月 11日
利用 NVIDIA Data Flywheel Blueprint 通過模型蒸餾構建高效的 AI 智能體
隨著企業加速采用代理式 AI,團隊在擴展智能應用程序的同時管理推理成本方面面臨著越來越大的挑戰。大語言模型 (LLM) 提供強大的性能,
2 MIN READ

2025年 6月 11日
通過開源 AI-Q NVIDIA Blueprint 與您的企業數據交流
企業數據呈爆炸式增長,PB 級的電子郵件、報告、Slack 消息和數據庫的堆積速度比任何人都快。市場調研人員 Gartner 表示,
2 MIN READ

2025年 6月 2日
通過高效的長上下文大語言模型訓練擴展到數百萬個 Token
大語言模型 (LLM) 的演變標志著其處理和生成文本的能力有了顯著提升。在這些發展中,上下文長度的概念 (模型可以處理的單個輸入樣本中的…
2 MIN READ

2025年 5月 28日
聚焦:使用 Iguazio 的 MLRun 和 NVIDIA NIM 構建可擴展和可觀察的 AI 以投入生產
Iguazio (被麥肯錫收購) 與 NVIDIA 的合作使企業組織能夠構建生產級 AI 解決方案,這些解決方案不僅具有高性能和可擴展性,
2 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上分析大型語言模型訓練工作流
AI 的快速發展催生了模型大小呈指數級增長的時代,特別是在大語言模型 (LLMs) 領域。這些模型憑借其變革能力,正在推動各行各業的創新。
3 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上訓練大型語言模型的高級優化策略
雖然分析有助于識別效率低下的情況,但高級優化策略對于解決硬件限制和有效擴展 AI 工作負載至關重要。在本文中,我們將探討 CPU 卸載、
3 MIN READ