生成型人工智能

2025年 7月 16日
CUTLASS:基于張量和空間微核處理多維數據的原理抽象
在生成式 AI 時代,充分發揮 GPU 的潛力對于訓練更好的模型和大規模服務用戶至關重要。通常,
4 MIN READ

2025年 7月 15日
借助 AWS 上的 NVIDIA Run:ai 加速 AI 模型編排
在開發和部署高級 AI 模型時,訪問可擴展的高效 GPU 基礎設施至關重要。但是,在云原生、容器化環境中管理此基礎設施可能既復雜又昂貴。
2 MIN READ

2025年 7月 11日
使用 SynthDa 提升合成數據增強和人體動作識別
人類動作識別是 AI 系統中的一項功能,專為監控、老年人護理和工業監控等安全關鍵型應用而設計。但是,許多現實世界的數據集受到數據不平衡、
2 MIN READ

2025年 7月 10日
借助 GliaCloud 和 NVIDIA Omniverse 庫加速視頻制作和定制
生成式 AI 視頻模型的激增以及這些模型引入的新工作流程,顯著提高了創意和營銷技術行業的生產效率,并提高了輸出質量。
1 MIN READ

2025年 7月 10日
從 TB 級到一站式解決方案:AI 驅動的氣候模型走向主流
在了解地球不斷變化的氣候的競賽中,速度和準確性至關重要。但當今使用最廣泛的氣候模擬器往往難以滿足需求:由于計算能力的限制,
2 MIN READ

2025年 7月 9日
使用 NVIDIA NeMo-RL 進行強化學習:通過 GRPO 復制 DeepScaleR 配方
強化學習 (RL) 是交互式 AI 的支柱。它對于教導智能體推理和從人類偏好中學習、實現多輪工具使用等至關重要。
2 MIN READ

2025年 7月 7日
LLM 推理基準測試:使用 TensorRT-LLM 進行性能調優
這是大語言模型延遲 – 吞吐量基準測試系列的第三篇博文,旨在指導開發者如何使用 TensorRT-LLM 對 LLM 推理進行基準測試。
3 MIN READ

2025年 7月 7日
使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠
隨著 AI 借助代理式 AI 向規劃、研究和推理發展,工作流變得越來越復雜。為了高效部署代理式 AI 應用,AI 云需要軟件定義、
2 MIN READ

2025年 7月 3日
新視頻:使用 NVIDIA Data Flywheel Blueprint 構建可自我提升的 AI 代理
由大語言模型驅動的 AI 智能體正在改變企業工作流,但高昂的推理成本和延遲可能會限制其可擴展性和用戶體驗。為解決這一問題,
1 MIN READ

2025年 7月 2日
通過低精度量化優化用于圖像編輯的 FLUX.1 Kontext
FLUX.1 Kontext 是 Black Forest Labs 最近發布的模型,是對社區圖像生成模型的一項令人著迷的補充。
3 MIN READ

2025年 7月 1日
如何使用 NVIDIA NeMo Agent 工具套件開源庫構建自定義 AI 智能體
AI 智能體通過轉變業務運營、自動執行復雜任務和解鎖新的效率,正在徹底改變數字員工隊伍。借助協作能力,這些智能體現在可以協同工作,
1 MIN READ

2025年 7月 1日
適用于有效 FP8 訓練的按張量和按塊擴展策略
在本博文中,我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…
2 MIN READ

2025年 6月 30日
出色的多模態 RAG:Llama 3.2 NeMo 檢索器嵌入模型如何提高工作流準確性
數據遠不止于文本,它本質上是多模態的,包括圖像、視頻、音頻等,通常采用復雜的非結構化格式。雖然常見的方法是將 PDF、掃描圖像、
2 MIN READ

2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上運行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 現已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上個月,
1 MIN READ

2025年 6月 25日
提高嵌入模型準確性,實現定制化信息檢索
自定義嵌入模型對于有效的信息檢索至關重要,尤其是在處理法律文本、病歷或多輪客戶對話等特定領域的數據時。通用、
2 MIN READ

2025年 6月 25日
如何使用 NVIDIA NeMo 技能簡化復雜的 LLM 工作流程
改進 LLM 的典型方法涉及多個階段:合成數據生成 (SDG) 、通過監督式微調 (SFT) 或強化學習 (RL) 進行模型訓練以及模型評估。
4 MIN READ