生成型人工智能

2025年 7月 16日

CUTLASS：基于張量和空間微核處理多維數據的原理抽象

在生成式 AI 時代，充分發揮 GPU 的潛力對于訓練更好的模型和大規模服務用戶至關重要。通常，

4 MIN READ

2025年 7月 15日

借助 AWS 上的 NVIDIA Run:ai 加速 AI 模型編排

在開發和部署高級 AI 模型時，訪問可擴展的高效 GPU 基礎設施至關重要。但是，在云原生、容器化環境中管理此基礎設施可能既復雜又昂貴。

2 MIN READ

2025年 7月 11日

使用 SynthDa 提升合成數據增強和人體動作識別

人類動作識別是 AI 系統中的一項功能，專為監控、老年人護理和工業監控等安全關鍵型應用而設計。但是，許多現實世界的數據集受到數據不平衡、

2 MIN READ

2025年 7月 10日

借助 GliaCloud 和 NVIDIA Omniverse 庫加速視頻制作和定制

生成式 AI 視頻模型的激增以及這些模型引入的新工作流程，顯著提高了創意和營銷技術行業的生產效率，并提高了輸出質量。

1 MIN READ

2025年 7月 10日

從 TB 級到一站式解決方案：AI 驅動的氣候模型走向主流

在了解地球不斷變化的氣候的競賽中，速度和準確性至關重要。但當今使用最廣泛的氣候模擬器往往難以滿足需求：由于計算能力的限制，

2 MIN READ

2025年 7月 9日

使用 NVIDIA NeMo-RL 進行強化學習：通過 GRPO 復制 DeepScaleR 配方

強化學習 (RL) 是交互式 AI 的支柱。它對于教導智能體推理和從人類偏好中學習、實現多輪工具使用等至關重要。

2 MIN READ

2025年 7月 7日

LLM 推理基準測試：使用 TensorRT-LLM 進行性能調優

這是大語言模型延遲 – 吞吐量基準測試系列的第三篇博文，旨在指導開發者如何使用 TensorRT-LLM 對 LLM 推理進行基準測試。

3 MIN READ

2025年 7月 7日

使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠

隨著 AI 借助代理式 AI 向規劃、研究和推理發展，工作流變得越來越復雜。為了高效部署代理式 AI 應用，AI 云需要軟件定義、

2 MIN READ

2025年 7月 3日

新視頻：使用 NVIDIA Data Flywheel Blueprint 構建可自我提升的 AI 代理

由大語言模型驅動的 AI 智能體正在改變企業工作流，但高昂的推理成本和延遲可能會限制其可擴展性和用戶體驗。為解決這一問題，

1 MIN READ

2025年 7月 2日

通過低精度量化優化用于圖像編輯的 FLUX.1 Kontext

FLUX.1 Kontext 是 Black Forest Labs 最近發布的模型，是對社區圖像生成模型的一項令人著迷的補充。

3 MIN READ

2025年 7月 1日

如何使用 NVIDIA NeMo Agent 工具套件開源庫構建自定義 AI 智能體

AI 智能體通過轉變業務運營、自動執行復雜任務和解鎖新的效率，正在徹底改變數字員工隊伍。借助協作能力，這些智能體現在可以協同工作，

1 MIN READ

2025年 7月 1日

適用于有效 FP8 訓練的按張量和按塊擴展策略

在本博文中，我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…

2 MIN READ

2025年 6月 30日

出色的多模態 RAG：Llama 3.2 NeMo 檢索器嵌入模型如何提高工作流準確性

數據遠不止于文本，它本質上是多模態的，包括圖像、視頻、音頻等，通常采用復雜的非結構化格式。雖然常見的方法是將 PDF、掃描圖像、

2 MIN READ

2025年 6月 26日

在 NVIDIA Jetson 和 RTX 上運行 Google DeepMind 的 Gemma 3n

截至今日，NVIDIA 現已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上個月，

1 MIN READ

2025年 6月 25日

提高嵌入模型準確性，實現定制化信息檢索

自定義嵌入模型對于有效的信息檢索至關重要，尤其是在處理法律文本、病歷或多輪客戶對話等特定領域的數據時。通用、

2 MIN READ

2025年 6月 25日

如何使用 NVIDIA NeMo 技能簡化復雜的 LLM 工作流程

改進 LLM 的典型方法涉及多個階段：合成數據生成 (SDG) 、通過監督式微調 (SFT) 或強化學習 (RL) 進行模型訓練以及模型評估。

4 MIN READ