NVIDIA 開發者博客 - 第4頁 - 閱讀開發者創建的最新技術信息、頭條新聞和內容。

生成式人工智能/大語言模型

突破延遲極限：在 NVIDIA Blackwell GPU 上優化 DeepSeek-R1 的性能
數據中心/云端

LLM 推理基準測試：使用 TensorRT-LLM 進行性能調優
數據中心/云端

使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠
模擬/建模/設計

NVIDIA cuQuantum 增加了動態梯度、DMRG 和模擬加速
數據科學

提出一個維基百科規模的問題：如何利用數百萬 token 的實時推理使世界更加智能

突破延遲極限：在 NVIDIA Blackwell GPU 上優化 DeepSeek-R1 的性能

近年來，大語言邏輯推理模型取得了顯著進步，但也帶來了新的部署挑戰。其中，因復雜的“思考與邏輯推理”過程而引起的輸出序列長度 (OSL)…

3 MIN READ

2025年 7月 7日

LLM 推理基準測試：使用 TensorRT-LLM 進行性能調優

這是大語言模型延遲 – 吞吐量基準測試系列的第三篇博文，旨在指導開發者如何使用 TensorRT-LLM 對 LLM 推理進行基準測試。

3 MIN READ

2025年 7月 7日

使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠

隨著 AI 借助代理式 AI 向規劃、研究和推理發展，工作流變得越來越復雜。為了高效部署代理式 AI 應用，AI 云需要軟件定義、

2 MIN READ

2025年 7月 7日

NVIDIA cuQuantum 增加了動態梯度、DMRG 和模擬加速

NVIDIA cuQuantum 是一個包含優化庫和工具的 SDK，可將電路和設備級別的量子計算模擬加速幾個數量級。

1 MIN READ

2025年 7月 7日

提出一個維基百科規模的問題：如何利用數百萬 token 的實時推理使世界更加智能

現代 AI 應用越來越依賴于將龐大的參數數量與數百萬個令牌的上下文窗口相結合的模型。無論是經過數月對話的 AI 智能體、

3 MIN READ

2025年 7月 3日

新視頻：使用 NVIDIA Data Flywheel Blueprint 構建可自我提升的 AI 代理

由大語言模型驅動的 AI 智能體正在改變企業工作流，但高昂的推理成本和延遲可能會限制其可擴展性和用戶體驗。為解決這一問題，

1 MIN READ

2025年 7月 3日

RAPIDS 新增 GPU Polars 串流、統一 GNN API 和零代碼 ML 加速功能

RAPIDS 是一套用于 Python 數據科學的 NVIDIA CUDA-X 庫，發布了 25.06 版本，引入了令人興奮的新功能。

2 MIN READ

2025年 7月 2日

通過低精度量化優化用于圖像編輯的 FLUX.1 Kontext

FLUX.1 Kontext 是 Black Forest Labs 最近發布的模型，是對社區圖像生成模型的一項令人著迷的補充。

3 MIN READ

增強現實/虛擬現實

查看全部

2025年 5月 18日

聚焦：Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 實現個性化的數字化美妝體驗

增強現實 (AR) 和 AI 通過提供從虛擬試用到 AI 驅動的造型推薦等超個性化體驗，正在徹底改變美妝和時尚行業。

1 MIN READ

2025年 5月 6日

借助 NVIDIA RTX PRO Blackwell 臺式機 GPU 實現 Rivian 新一代XR 設計

對于不斷突破 XR 界限的專業人士而言，打造身臨其境的高保真體驗始終充滿挑戰。在渲染大型數據集和驅動最新的超高分辨率高級 XR 頭顯設備時，

2 MIN READ

2025年 3月 5日

借助 NVIDIA Omniverse 將 AR 體驗串流到 Apple iPad

最近在 MWC 巴塞羅那宣布，開發者現在可以將使用 NVIDIA Omniverse 構建的增強現實（AR）體驗流式傳輸到 Apple…

1 MIN READ

2025年 2月 24日

在 NVIDIA 視頻編解碼器 SDK 13.0 中使用 MV-HEVC 啟用立體和 3D 視圖

NVIDIA 宣布在最新的 NVIDIA 視頻編解碼器 SDK 版本 13.0 中實施多視圖高效視頻編碼 (MV-HEVC) 編碼器。

2 MIN READ

2025年 1月 6日

利用 NVIDIA Omniverse 空間流，在 XR 中體驗數字孿生技術

空間計算體驗正在轉變我們與數據的交互方式，通過擴展現實 (XR) 和數字孿生等技術連接物理和數字世界。

2 MIN READ

2024年 10月 24日

利用 NVIDIA Morpheus 加速警報分流和 LLM 代理強化安全運營中心

安全運營中心（SOC）分析師每天都會收到大量傳入的安全警報。為了確保其組織的持續安全，他們的任務是仔細檢查傳入的噪音，分揀出誤報，

1 MIN READ

2024年 10月 22日

多代理 AI 和 GPU 驅動的聲音轉文本技術創新

自動音頻字幕 (Automated Audio Captioning) 任務的核心是從音頻輸入中生成自然語言描述。鑒于輸入 (音頻) 和輸出…

2 MIN READ

2024年 10月 14日

AI 驅動模擬和數字孿生技術助力手術機器人技術創新發展

在手術室中集成機器人手術助手（RSAs）為外科醫生和患者的治療效果帶來了巨大的優勢。目前，

1 MIN READ

數據科學

查看全部

2025年 7月 1日

適用于有效 FP8 訓練的按張量和按塊擴展策略

在本博文中，我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…

2 MIN READ

2025年 6月 27日

AI 分析護士觀察記錄以降低患者危險

研究人員開發了一款 AI 賦能的工具，可以分析護士的輪班筆記，從而比傳統方法更早地識別入院患者的健康狀況可能惡化或處于“崩潰”的邊緣…

1 MIN READ

2025年 6月 27日

如何在 Polars GPU 引擎中處理超過 VRAM 的數據

在量化金融、算法交易和欺詐檢測等高風險領域，數據從業者經常需要處理數百 GB 的數據，才能快速做出明智的決策。

1 MIN READ

2025年 6月 25日

提高嵌入模型準確性，實現定制化信息檢索

自定義嵌入模型對于有效的信息檢索至關重要，尤其是在處理法律文本、病歷或多輪客戶對話等特定領域的數據時。通用、

2 MIN READ

2025年 6月 25日

如何使用 NVIDIA NeMo 技能簡化復雜的 LLM 工作流程

改進 LLM 的典型方法涉及多個階段：合成數據生成 (SDG) 、通過監督式微調 (SFT) 或強化學習 (RL) 進行模型訓練以及模型評估。

4 MIN READ

2025年 6月 18日

NVIDIA 在制造和運營領域的 AI 應用：借助 NVIDIA CUDA-X 數據科學加速 ML 模型

從晶圓制造和電路探測到封裝芯片測試，NVIDIA 利用數據科學和機器學習來優化芯片制造和運營工作流程。這些階段會產生 TB 級的數據，

3 MIN READ

2025年 6月 18日

借助 NVIDIA NIM 推理微服務和 ITMonitron 實現實時 IT 事故檢測和情報

在當今快節奏的 IT 環境中，并非所有事件都始于明顯的警報。這些問題可能始于細微的分散信號、錯過的警報、悄無聲息的 SLO 漏洞，

2 MIN READ

2025年 6月 16日

人工智能致力于為法律領域帶來秩序

斯坦福大學的一個研究團隊開發了一個 LLM 系統，以減少官樣文章。被稱為“System for Statutory Research”…

1 MIN READ

NVIDIA 技術博客

突破延遲極限：在 NVIDIA Blackwell GPU 上優化 DeepSeek-R1 的性能

LLM 推理基準測試：使用 TensorRT-LLM 進行性能調優

使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠

NVIDIA cuQuantum 增加了動態梯度、DMRG 和模擬加速

提出一個維基百科規模的問題：如何利用數百萬 token 的實時推理使世界更加智能

最近

突破延遲極限：在 NVIDIA Blackwell GPU 上優化 DeepSeek-R1 的性能

LLM 推理基準測試：使用 TensorRT-LLM 進行性能調優

使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠

NVIDIA cuQuantum 增加了動態梯度、DMRG 和模擬加速

提出一個維基百科規模的問題：如何利用數百萬 token 的實時推理使世界更加智能

新視頻：使用 NVIDIA Data Flywheel Blueprint 構建可自我提升的 AI 代理

RAPIDS 新增 GPU Polars 串流、統一 GNN API 和零代碼 ML 加速功能

通過低精度量化優化用于圖像編輯的 FLUX.1 Kontext

增強現實/虛擬現實

聚焦：Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 實現個性化的數字化美妝體驗

借助 NVIDIA RTX PRO Blackwell 臺式機 GPU 實現 Rivian 新一代XR 設計

借助 NVIDIA Omniverse 將 AR 體驗串流到 Apple iPad

在 NVIDIA 視頻編解碼器 SDK 13.0 中使用 MV-HEVC 啟用立體和 3D 視圖

利用 NVIDIA Omniverse 空間流，在 XR 中體驗數字孿生技術

利用 NVIDIA Morpheus 加速警報分流和 LLM 代理強化安全運營中心

多代理 AI 和 GPU 驅動的聲音轉文本技術創新

AI 驅動模擬和數字孿生技術助力手術機器人技術創新發展

數據科學

適用于有效 FP8 訓練的按張量和按塊擴展策略

AI 分析護士觀察記錄以降低患者危險

如何在 Polars GPU 引擎中處理超過 VRAM 的數據

提高嵌入模型準確性，實現定制化信息檢索

如何使用 NVIDIA NeMo 技能簡化復雜的 LLM 工作流程

NVIDIA 在制造和運營領域的 AI 應用：借助 NVIDIA CUDA-X 數據科學加速 ML 模型

借助 NVIDIA NIM 推理微服務和 ITMonitron 實現實時 IT 事故檢測和情報

人工智能致力于為法律領域帶來秩序