Intermediate Technical

2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 進行無服務器分布式數據處理
將大量文本庫轉換為數字表示 (稱為嵌入) 的過程對于生成式 AI 至關重要。從語義搜索和推薦引擎到檢索增強生成 (RAG) ,
2 MIN READ

2025年 7月 23日
PDF 數據提取方法及其在信息檢索中的應用
PDF 是共享財務報告、研究論文、技術文檔和營銷材料等信息的常用文件格式之一。然而,在構建有效的檢索增強生成 (RAG) 系統時,
4 MIN READ

2025年 7月 22日
了解 NCCL 調優以加速 GPU 之間的通信
NVIDIA 集合通信庫 (NCCL) 對于 AI 工作負載中的快速 GPU 到 GPU 通信至關重要,可使用各種優化和調優來提升性能。但是,
3 MIN READ

2025年 7月 22日
使用 NVIDIA NeMo 在一個周末內訓練一個具備推理能力的 LLM
您是否曾想構建自己的推理模型,但認為它過于復雜或需要大量資源?再想想。借助 NVIDIA 強大的工具和數據集,
4 MIN READ

2025年 7月 18日
使用 JAX 和 XLA 優化推理工作負載的低延遲通信
在生產環境中使用大語言模型 (LLM) 進行推理需要滿足嚴格的延遲限制。此過程的關鍵階段是 LLM 解碼,
2 MIN READ

2025年 7月 17日
使用 NVIDIA 安全配方保護代理式 AI 系統
隨著大語言模型 (LLM) 驅動更多能夠執行自主操作、工具使用和推理的代理式系統,企業被其靈活性和低推理成本所吸引。
2 MIN READ

2025年 7月 17日
大規模特征工程:利用 NVIDIA CUDA-X 數據科學優化半導體制造的機器學習模型
在上一篇博文中,我們介紹了芯片制造和運營中的預測建模設置,重點介紹了數據集不平衡等常見挑戰,以及對更細致的評估指標的需求。
2 MIN READ

2025年 7月 16日
CUTLASS 3.x:用于 GEMM 內核設計的正交、可重用和組合抽象
GPU 上的 GEMM 優化是一個模塊化問題。高性能實現需要指定超參數,例如圖塊形狀、數學和復制指令以及線程束專用方案。
3 MIN READ

2025年 7月 15日
NVIDIA Dynamo 新增對 AWS 服務的支持,可大規模提供經濟高效的推理
Amazon Web Services (AWS) 開發者和解決方案架構師現在可以在基于 NVIDIA GPU 的 Amazon EC2…
2 MIN READ

2025年 7月 14日
NCCL 深度解析:跨數據中心通信與網絡拓撲感知
隨著 AI 訓練規模的擴大,單個數據中心 (DC) 不足以提供所需的計算能力。
2 MIN READ

2025年 7月 14日
借助 NVIDIA Riva TTS 增強多語種類似人類的語音和語音克隆
雖然語音 AI 用于構建數字助理和語音智能體,但其影響遠遠超出這些應用。文本轉語音 (TTS) 和自動語音識別 (ASR)…
3 MIN READ

2025年 7月 14日
借助 NCCL 2.27 實現快速推理和彈性訓練
隨著 AI 工作負載的擴展,快速可靠的 GPU 通信變得至關重要,這不僅適用于訓練,而且越來越適用于大規模推理。
3 MIN READ

2025年 7月 11日
使用 NVIDIA Earth-2 預測兩周以上的天氣
能夠預測極端天氣事件至關重要,因為此類條件變得更加常見且更具破壞性。次季節性氣候預測 (預測未來兩周或兩周以上的天氣)…
2 MIN READ

2025年 7月 9日
為 NVIDIA CUDA 內核融合提供 Python 中缺失的構建模塊
CUB 和 Thrust 等 C++ 庫提供高級構建塊,使 NVIDIA CUDA 應用和庫開發者能夠編寫跨架構可移植的光速代碼。
2 MIN READ

2025年 7月 9日
使用 NVIDIA NeMo-RL 進行強化學習:通過 GRPO 復制 DeepScaleR 配方
強化學習 (RL) 是交互式 AI 的支柱。它對于教導智能體推理和從人類偏好中學習、實現多輪工具使用等至關重要。
2 MIN READ

2025年 7月 7日
使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠
隨著 AI 借助代理式 AI 向規劃、研究和推理發展,工作流變得越來越復雜。為了高效部署代理式 AI 應用,AI 云需要軟件定義、
2 MIN READ