Deep dive

2025年 7月 23日
PDF 數據提取方法及其在信息檢索中的應用
PDF 是共享財務報告、研究論文、技術文檔和營銷材料等信息的常用文件格式之一。然而,在構建有效的檢索增強生成 (RAG) 系統時,
4 MIN READ

2025年 7月 22日
使用 NVIDIA Warp 和高斯拋物線法構建機器人心理模型
本文將探討構建物理世界的動態數字表示的光明方向,這一主題在近期研究中日益受到關注。我們引入了一種在機器人環境中構建數字孿生的方法,
1 MIN READ

2025年 7月 22日
了解 NCCL 調優以加速 GPU 之間的通信
NVIDIA 集合通信庫 (NCCL) 對于 AI 工作負載中的快速 GPU 到 GPU 通信至關重要,可使用各種優化和調優來提升性能。但是,
3 MIN READ

2025年 7月 21日
傳統 RAG 與代理 RAG——AI 智能體如何通過動態知識實現更高智能
是否曾依賴不知道新高速公路旁路或道路突然關閉的舊 GPS?它可能會讓您到達目的地,但不是最有效或最準確的方式。
1 MIN READ

2025年 7月 17日
使用 NVIDIA 安全配方保護代理式 AI 系統
隨著大語言模型 (LLM) 驅動更多能夠執行自主操作、工具使用和推理的代理式系統,企業被其靈活性和低推理成本所吸引。
2 MIN READ

2025年 7月 16日
R2D2:利用 NVIDIA 研究工作流和全局基礎模型訓練通用機器人
機器人領域的一項主要挑戰是訓練機器人執行新任務,而無需為每個新任務和環境收集和標記數據集。
3 MIN READ

2025年 7月 16日
CUTLASS:基于張量和空間微核處理多維數據的原理抽象
在生成式 AI 時代,充分發揮 GPU 的潛力對于訓練更好的模型和大規模服務用戶至關重要。通常,
4 MIN READ

2025年 7月 16日
CUTLASS 3.x:用于 GEMM 內核設計的正交、可重用和組合抽象
GPU 上的 GEMM 優化是一個模塊化問題。高性能實現需要指定超參數,例如圖塊形狀、數學和復制指令以及線程束專用方案。
3 MIN READ

2025年 7月 14日
借助 NVIDIA Riva TTS 增強多語種類似人類的語音和語音克隆
雖然語音 AI 用于構建數字助理和語音智能體,但其影響遠遠超出這些應用。文本轉語音 (TTS) 和自動語音識別 (ASR)…
3 MIN READ

2025年 7月 14日
借助 NCCL 2.27 實現快速推理和彈性訓練
隨著 AI 工作負載的擴展,快速可靠的 GPU 通信變得至關重要,這不僅適用于訓練,而且越來越適用于大規模推理。
3 MIN READ

2025年 7月 11日
使用 SynthDa 提升合成數據增強和人體動作識別
人類動作識別是 AI 系統中的一項功能,專為監控、老年人護理和工業監控等安全關鍵型應用而設計。但是,許多現實世界的數據集受到數據不平衡、
2 MIN READ

2025年 7月 10日
InfiniBand 多層安全保護數據中心和 AI 工作負載
在當今數據驅動的世界中,安全性不僅僅是一項功能,更是基礎。隨著 AI、HPC 和超大規模云計算的指數級增長,
1 MIN READ

2025年 7月 2日
通過低精度量化優化用于圖像編輯的 FLUX.1 Kontext
FLUX.1 Kontext 是 Black Forest Labs 最近發布的模型,是對社區圖像生成模型的一項令人著迷的補充。
3 MIN READ

2025年 7月 1日
適用于有效 FP8 訓練的按張量和按塊擴展策略
在本博文中,我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…
2 MIN READ

2025年 6月 30日
出色的多模態 RAG:Llama 3.2 NeMo 檢索器嵌入模型如何提高工作流準確性
數據遠不止于文本,它本質上是多模態的,包括圖像、視頻、音頻等,通常采用復雜的非結構化格式。雖然常見的方法是將 PDF、掃描圖像、
2 MIN READ

2025年 6月 25日
NVIDIA DOCA 3.0 助力 AI 平臺開啟網絡新紀元
NVIDIA DOCA 框架已發展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發布,
3 MIN READ