生成式人工智能/大語言模型

2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 進行無服務器分布式數據處理
將大量文本庫轉換為數字表示 (稱為嵌入) 的過程對于生成式 AI 至關重要。從語義搜索和推薦引擎到檢索增強生成 (RAG) ,
2 MIN READ

2025年 7月 23日
PDF 數據提取方法及其在信息檢索中的應用
PDF 是共享財務報告、研究論文、技術文檔和營銷材料等信息的常用文件格式之一。然而,在構建有效的檢索增強生成 (RAG) 系統時,
4 MIN READ

2025年 7月 22日
使用 NVIDIA NeMo 在一個周末內訓練一個具備推理能力的 LLM
您是否曾想構建自己的推理模型,但認為它過于復雜或需要大量資源?再想想。借助 NVIDIA 強大的工具和數據集,
4 MIN READ

2025年 7月 21日
傳統 RAG 與代理 RAG——AI 智能體如何通過動態知識實現更高智能
是否曾依賴不知道新高速公路旁路或道路突然關閉的舊 GPS?它可能會讓您到達目的地,但不是最有效或最準確的方式。
1 MIN READ

2025年 7月 21日
使用 NVIDIA ?Nsight Systems 分析 Ray 負載(verl)的性能
在大語言模型的強化學習訓練過程中,GPU 性能優化至關重要。隨著模型規模不斷擴大,
2 MIN READ

2025年 7月 17日
使用 NVIDIA 安全配方保護代理式 AI 系統
隨著大語言模型 (LLM) 驅動更多能夠執行自主操作、工具使用和推理的代理式系統,企業被其靈活性和低推理成本所吸引。
2 MIN READ

2025年 7月 17日
黑客松獲獎者借助 NVIDIA NeMo Agent Toolkit 讓代理式 AI 如生
學習新工具包的最佳方式是構建一些真實的東西,這正是開發者在最近的 NVIDIA NeMo Agent 工具包黑客松上所做的。在兩周的時間里,
1 MIN READ

2025年 7月 16日
CUTLASS:基于張量和空間微核處理多維數據的原理抽象
在生成式 AI 時代,充分發揮 GPU 的潛力對于訓練更好的模型和大規模服務用戶至關重要。通常,
4 MIN READ

2025年 7月 15日
借助 AWS 上的 NVIDIA Run:ai 加速 AI 模型編排
在開發和部署高級 AI 模型時,訪問可擴展的高效 GPU 基礎設施至關重要。但是,在云原生、容器化環境中管理此基礎設施可能既復雜又昂貴。
2 MIN READ

2025年 7月 11日
使用 SynthDa 提升合成數據增強和人體動作識別
人類動作識別是 AI 系統中的一項功能,專為監控、老年人護理和工業監控等安全關鍵型應用而設計。但是,許多現實世界的數據集受到數據不平衡、
2 MIN READ

2025年 7月 11日
突破延遲極限:在 NVIDIA Blackwell GPU 上優化 DeepSeek-R1 的性能
近年來,大語言邏輯推理模型取得了顯著進步,但也帶來了新的部署挑戰。其中,因復雜的“思考與邏輯推理”過程而引起的輸出序列長度 (OSL)…
3 MIN READ

2025年 7月 10日
借助 GliaCloud 和 NVIDIA Omniverse 庫加速視頻制作和定制
生成式 AI 視頻模型的激增以及這些模型引入的新工作流程,顯著提高了創意和營銷技術行業的生產效率,并提高了輸出質量。
1 MIN READ

2025年 7月 10日
從 TB 級到一站式解決方案:AI 驅動的氣候模型走向主流
在了解地球不斷變化的氣候的競賽中,速度和準確性至關重要。但當今使用最廣泛的氣候模擬器往往難以滿足需求:由于計算能力的限制,
2 MIN READ

2025年 7月 9日
使用 NVIDIA NeMo-RL 進行強化學習:通過 GRPO 復制 DeepScaleR 配方
強化學習 (RL) 是交互式 AI 的支柱。它對于教導智能體推理和從人類偏好中學習、實現多輪工具使用等至關重要。
2 MIN READ

2025年 7月 7日
LLM 推理基準測試:使用 TensorRT-LLM 進行性能調優
這是大語言模型延遲 – 吞吐量基準測試系列的第三篇博文,旨在指導開發者如何使用 TensorRT-LLM 對 LLM 推理進行基準測試。
3 MIN READ

2025年 7月 7日
使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠
隨著 AI 借助代理式 AI 向規劃、研究和推理發展,工作流變得越來越復雜。為了高效部署代理式 AI 應用,AI 云需要軟件定義、
2 MIN READ