Intermediate Technical

2025年 7月 23日

在 Azure 上使用 Apache Spark 和 NVIDIA AI 進行無服務器分布式數據處理

將大量文本庫轉換為數字表示 (稱為嵌入) 的過程對于生成式 AI 至關重要。從語義搜索和推薦引擎到檢索增強生成 (RAG) ，

2 MIN READ

2025年 7月 23日

PDF 數據提取方法及其在信息檢索中的應用

PDF 是共享財務報告、研究論文、技術文檔和營銷材料等信息的常用文件格式之一。然而，在構建有效的檢索增強生成 (RAG) 系統時，

4 MIN READ

2025年 7月 22日

了解 NCCL 調優以加速 GPU 之間的通信

NVIDIA 集合通信庫 (NCCL) 對于 AI 工作負載中的快速 GPU 到 GPU 通信至關重要，可使用各種優化和調優來提升性能。但是，

3 MIN READ

2025年 7月 22日

使用 NVIDIA NeMo 在一個周末內訓練一個具備推理能力的 LLM

您是否曾想構建自己的推理模型，但認為它過于復雜或需要大量資源？再想想。借助 NVIDIA 強大的工具和數據集，

4 MIN READ

2025年 7月 18日

使用 JAX 和 XLA 優化推理工作負載的低延遲通信

在生產環境中使用大語言模型 (LLM) 進行推理需要滿足嚴格的延遲限制。此過程的關鍵階段是 LLM 解碼，

2 MIN READ

2025年 7月 17日

使用 NVIDIA 安全配方保護代理式 AI 系統

隨著大語言模型 (LLM) 驅動更多能夠執行自主操作、工具使用和推理的代理式系統，企業被其靈活性和低推理成本所吸引。

2 MIN READ

2025年 7月 17日

大規模特征工程：利用 NVIDIA CUDA-X 數據科學優化半導體制造的機器學習模型

在上一篇博文中，我們介紹了芯片制造和運營中的預測建模設置，重點介紹了數據集不平衡等常見挑戰，以及對更細致的評估指標的需求。

2 MIN READ

2025年 7月 16日

CUTLASS 3.x：用于 GEMM 內核設計的正交、可重用和組合抽象

GPU 上的 GEMM 優化是一個模塊化問題。高性能實現需要指定超參數，例如圖塊形狀、數學和復制指令以及線程束專用方案。

3 MIN READ

2025年 7月 15日

NVIDIA Dynamo 新增對 AWS 服務的支持，可大規模提供經濟高效的推理

Amazon Web Services (AWS) 開發者和解決方案架構師現在可以在基于 NVIDIA GPU 的 Amazon EC2…

2 MIN READ

2025年 7月 14日

NCCL 深度解析：跨數據中心通信與網絡拓撲感知

隨著 AI 訓練規模的擴大，單個數據中心 (DC) 不足以提供所需的計算能力。

2 MIN READ

2025年 7月 14日

借助 NVIDIA Riva TTS 增強多語種類似人類的語音和語音克隆

雖然語音 AI 用于構建數字助理和語音智能體，但其影響遠遠超出這些應用。文本轉語音 (TTS) 和自動語音識別 (ASR)…

3 MIN READ

2025年 7月 14日

借助 NCCL 2.27 實現快速推理和彈性訓練

隨著 AI 工作負載的擴展，快速可靠的 GPU 通信變得至關重要，這不僅適用于訓練，而且越來越適用于大規模推理。

3 MIN READ

2025年 7月 11日

使用 NVIDIA Earth-2 預測兩周以上的天氣

能夠預測極端天氣事件至關重要，因為此類條件變得更加常見且更具破壞性。次季節性氣候預測 (預測未來兩周或兩周以上的天氣)…

2 MIN READ

2025年 7月 9日

為 NVIDIA CUDA 內核融合提供 Python 中缺失的構建模塊

CUB 和 Thrust 等 C++ 庫提供高級構建塊，使 NVIDIA CUDA 應用和庫開發者能夠編寫跨架構可移植的光速代碼。

2 MIN READ

2025年 7月 9日

使用 NVIDIA NeMo-RL 進行強化學習：通過 GRPO 復制 DeepScaleR 配方

強化學習 (RL) 是交互式 AI 的支柱。它對于教導智能體推理和從人類偏好中學習、實現多輪工具使用等至關重要。

2 MIN READ

2025年 7月 7日

使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠

隨著 AI 借助代理式 AI 向規劃、研究和推理發展，工作流變得越來越復雜。為了高效部署代理式 AI 應用，AI 云需要軟件定義、

2 MIN READ