General

2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 進行無服務器分布式數據處理
將大量文本庫轉換為數字表示 (稱為嵌入) 的過程對于生成式 AI 至關重要。從語義搜索和推薦引擎到檢索增強生成 (RAG) ,
2 MIN READ

2025年 7月 23日
PDF 數據提取方法及其在信息檢索中的應用
PDF 是共享財務報告、研究論文、技術文檔和營銷材料等信息的常用文件格式之一。然而,在構建有效的檢索增強生成 (RAG) 系統時,
4 MIN READ

2025年 7月 22日
使用 NVIDIA Warp 和高斯拋物線法構建機器人心理模型
本文將探討構建物理世界的動態數字表示的光明方向,這一主題在近期研究中日益受到關注。我們引入了一種在機器人環境中構建數字孿生的方法,
1 MIN READ

2025年 7月 22日
了解 NCCL 調優以加速 GPU 之間的通信
NVIDIA 集合通信庫 (NCCL) 對于 AI 工作負載中的快速 GPU 到 GPU 通信至關重要,可使用各種優化和調優來提升性能。但是,
3 MIN READ

2025年 7月 22日
使用 NVIDIA NeMo 在一個周末內訓練一個具備推理能力的 LLM
您是否曾想構建自己的推理模型,但認為它過于復雜或需要大量資源?再想想。借助 NVIDIA 強大的工具和數據集,
4 MIN READ

2025年 7月 21日
傳統 RAG 與代理 RAG——AI 智能體如何通過動態知識實現更高智能
是否曾依賴不知道新高速公路旁路或道路突然關閉的舊 GPS?它可能會讓您到達目的地,但不是最有效或最準確的方式。
1 MIN READ

2025年 7月 18日
3 個 pandas 工作流在大型數據集上嚴重變慢,直到啟用了 GPU 加速
如果您使用 pandas,您可能已經撞到了墻壁。正是在這個時刻,您值得信賴的工作流程在處理較小的數據集時表現出色,在處理大型數據集時陷入停頓。
1 MIN READ

2025年 7月 18日
使用 JAX 和 XLA 優化推理工作負載的低延遲通信
在生產環境中使用大語言模型 (LLM) 進行推理需要滿足嚴格的延遲限制。此過程的關鍵階段是 LLM 解碼,
2 MIN READ

2025年 7月 17日
使用 NVIDIA 安全配方保護代理式 AI 系統
隨著大語言模型 (LLM) 驅動更多能夠執行自主操作、工具使用和推理的代理式系統,企業被其靈活性和低推理成本所吸引。
2 MIN READ

2025年 7月 17日
黑客松獲獎者借助 NVIDIA NeMo Agent Toolkit 讓代理式 AI 如生
學習新工具包的最佳方式是構建一些真實的東西,這正是開發者在最近的 NVIDIA NeMo Agent 工具包黑客松上所做的。在兩周的時間里,
1 MIN READ

2025年 7月 16日
R2D2:利用 NVIDIA 研究工作流和全局基礎模型訓練通用機器人
機器人領域的一項主要挑戰是訓練機器人執行新任務,而無需為每個新任務和環境收集和標記數據集。
3 MIN READ

2025年 7月 16日
CUTLASS:基于張量和空間微核處理多維數據的原理抽象
在生成式 AI 時代,充分發揮 GPU 的潛力對于訓練更好的模型和大規模服務用戶至關重要。通常,
4 MIN READ

2025年 7月 16日
CUTLASS 3.x:用于 GEMM 內核設計的正交、可重用和組合抽象
GPU 上的 GEMM 優化是一個模塊化問題。高性能實現需要指定超參數,例如圖塊形狀、數學和復制指令以及線程束專用方案。
3 MIN READ

2025年 7月 15日
NVIDIA Dynamo 新增對 AWS 服務的支持,可大規模提供經濟高效的推理
Amazon Web Services (AWS) 開發者和解決方案架構師現在可以在基于 NVIDIA GPU 的 Amazon EC2…
2 MIN READ

2025年 7月 14日
NCCL 深度解析:跨數據中心通信與網絡拓撲感知
隨著 AI 訓練規模的擴大,單個數據中心 (DC) 不足以提供所需的計算能力。
2 MIN READ

2025年 7月 14日
借助 NVIDIA Riva TTS 增強多語種類似人類的語音和語音克隆
雖然語音 AI 用于構建數字助理和語音智能體,但其影響遠遠超出這些應用。文本轉語音 (TTS) 和自動語音識別 (ASR)…
3 MIN READ