Deep dive

2025年 7月 23日

PDF 數據提取方法及其在信息檢索中的應用

PDF 是共享財務報告、研究論文、技術文檔和營銷材料等信息的常用文件格式之一。然而，在構建有效的檢索增強生成 (RAG) 系統時，

4 MIN READ

2025年 7月 22日

使用 NVIDIA Warp 和高斯拋物線法構建機器人心理模型

本文將探討構建物理世界的動態數字表示的光明方向，這一主題在近期研究中日益受到關注。我們引入了一種在機器人環境中構建數字孿生的方法，

1 MIN READ

2025年 7月 22日

了解 NCCL 調優以加速 GPU 之間的通信

NVIDIA 集合通信庫 (NCCL) 對于 AI 工作負載中的快速 GPU 到 GPU 通信至關重要，可使用各種優化和調優來提升性能。但是，

3 MIN READ

2025年 7月 21日

傳統 RAG 與代理 RAG——AI 智能體如何通過動態知識實現更高智能

是否曾依賴不知道新高速公路旁路或道路突然關閉的舊 GPS？它可能會讓您到達目的地，但不是最有效或最準確的方式。

1 MIN READ

2025年 7月 17日

使用 NVIDIA 安全配方保護代理式 AI 系統

隨著大語言模型 (LLM) 驅動更多能夠執行自主操作、工具使用和推理的代理式系統，企業被其靈活性和低推理成本所吸引。

2 MIN READ

2025年 7月 16日

R2D2：利用 NVIDIA 研究工作流和全局基礎模型訓練通用機器人

機器人領域的一項主要挑戰是訓練機器人執行新任務，而無需為每個新任務和環境收集和標記數據集。

3 MIN READ

2025年 7月 16日

CUTLASS：基于張量和空間微核處理多維數據的原理抽象

在生成式 AI 時代，充分發揮 GPU 的潛力對于訓練更好的模型和大規模服務用戶至關重要。通常，

4 MIN READ

2025年 7月 16日

CUTLASS 3.x：用于 GEMM 內核設計的正交、可重用和組合抽象

GPU 上的 GEMM 優化是一個模塊化問題。高性能實現需要指定超參數，例如圖塊形狀、數學和復制指令以及線程束專用方案。

3 MIN READ

2025年 7月 14日

借助 NVIDIA Riva TTS 增強多語種類似人類的語音和語音克隆

雖然語音 AI 用于構建數字助理和語音智能體，但其影響遠遠超出這些應用。文本轉語音 (TTS) 和自動語音識別 (ASR)…

3 MIN READ

2025年 7月 14日

借助 NCCL 2.27 實現快速推理和彈性訓練

隨著 AI 工作負載的擴展，快速可靠的 GPU 通信變得至關重要，這不僅適用于訓練，而且越來越適用于大規模推理。

3 MIN READ

2025年 7月 11日

使用 SynthDa 提升合成數據增強和人體動作識別

人類動作識別是 AI 系統中的一項功能，專為監控、老年人護理和工業監控等安全關鍵型應用而設計。但是，許多現實世界的數據集受到數據不平衡、

2 MIN READ

2025年 7月 10日

InfiniBand 多層安全保護數據中心和 AI 工作負載

在當今數據驅動的世界中，安全性不僅僅是一項功能，更是基礎。隨著 AI、HPC 和超大規模云計算的指數級增長，

1 MIN READ

2025年 7月 2日

通過低精度量化優化用于圖像編輯的 FLUX.1 Kontext

FLUX.1 Kontext 是 Black Forest Labs 最近發布的模型，是對社區圖像生成模型的一項令人著迷的補充。

3 MIN READ

2025年 7月 1日

適用于有效 FP8 訓練的按張量和按塊擴展策略

在本博文中，我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…

2 MIN READ

2025年 6月 30日

出色的多模態 RAG：Llama 3.2 NeMo 檢索器嵌入模型如何提高工作流準確性

數據遠不止于文本，它本質上是多模態的，包括圖像、視頻、音頻等，通常采用復雜的非結構化格式。雖然常見的方法是將 PDF、掃描圖像、

2 MIN READ

2025年 6月 25日

NVIDIA DOCA 3.0 助力 AI 平臺開啟網絡新紀元

NVIDIA DOCA 框架已發展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發布，

3 MIN READ