NVIDIA 技術博客
-
生成式人工智能/大語言模型突破延遲極限:在 NVIDIA Blackwell GPU 上優化 DeepSeek-R1 的性能
-
數據中心/云端LLM 推理基準測試:使用 TensorRT-LLM 進行性能調優
-
數據中心/云端使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠
-
模擬/建模/設計NVIDIA cuQuantum 增加了動態梯度、DMRG 和模擬加速
-
數據科學提出一個維基百科規模的問題:如何利用數百萬 token 的實時推理使世界更加智能
最近

2025年 7月 11日
突破延遲極限:在 NVIDIA Blackwell GPU 上優化 DeepSeek-R1 的性能
近年來,大語言邏輯推理模型取得了顯著進步,但也帶來了新的部署挑戰。其中,因復雜的“思考與邏輯推理”過程而引起的輸出序列長度 (OSL)…
3 MIN READ

2025年 7月 7日
LLM 推理基準測試:使用 TensorRT-LLM 進行性能調優
這是大語言模型延遲 – 吞吐量基準測試系列的第三篇博文,旨在指導開發者如何使用 TensorRT-LLM 對 LLM 推理進行基準測試。
3 MIN READ

2025年 7月 7日
使用 DPU 加速的 Kubernetes 服務代理增強 AI 工廠
隨著 AI 借助代理式 AI 向規劃、研究和推理發展,工作流變得越來越復雜。為了高效部署代理式 AI 應用,AI 云需要軟件定義、
2 MIN READ

2025年 7月 7日
NVIDIA cuQuantum 增加了動態梯度、DMRG 和模擬加速
NVIDIA cuQuantum 是一個包含優化庫和工具的 SDK,可將電路和設備級別的量子計算模擬加速幾個數量級。
1 MIN READ

2025年 7月 7日
提出一個維基百科規模的問題:如何利用數百萬 token 的實時推理使世界更加智能
現代 AI 應用越來越依賴于將龐大的參數數量與數百萬個令牌的上下文窗口相結合的模型。無論是經過數月對話的 AI 智能體、
3 MIN READ

2025年 7月 3日
新視頻:使用 NVIDIA Data Flywheel Blueprint 構建可自我提升的 AI 代理
由大語言模型驅動的 AI 智能體正在改變企業工作流,但高昂的推理成本和延遲可能會限制其可擴展性和用戶體驗。為解決這一問題,
1 MIN READ

2025年 7月 3日
RAPIDS 新增 GPU Polars 串流、統一 GNN API 和零代碼 ML 加速功能
RAPIDS 是一套用于 Python 數據科學的 NVIDIA CUDA-X 庫,發布了 25.06 版本,引入了令人興奮的新功能。
2 MIN READ

2025年 7月 2日
通過低精度量化優化用于圖像編輯的 FLUX.1 Kontext
FLUX.1 Kontext 是 Black Forest Labs 最近發布的模型,是對社區圖像生成模型的一項令人著迷的補充。
3 MIN READ
增強現實/虛擬現實

2025年 5月 18日
聚焦:Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 實現個性化的數字化美妝體驗
增強現實 (AR) 和 AI 通過提供從虛擬試用到 AI 驅動的造型推薦等超個性化體驗,正在徹底改變美妝和時尚行業。
1 MIN READ

2025年 5月 6日
借助 NVIDIA RTX PRO Blackwell 臺式機 GPU 實現 Rivian 新一代XR 設計
對于不斷突破 XR 界限的專業人士而言,打造身臨其境的高保真體驗始終充滿挑戰。在渲染大型數據集和驅動最新的超高分辨率高級 XR 頭顯設備時,
2 MIN READ

2025年 3月 5日
借助 NVIDIA Omniverse 將 AR 體驗串流到 Apple iPad
最近在 MWC 巴塞羅那宣布 ,開發者現在可以將使用 NVIDIA Omniverse 構建的增強現實(AR)體驗流式傳輸到 Apple…
1 MIN READ

2025年 2月 24日
在 NVIDIA 視頻編解碼器 SDK 13.0 中使用 MV-HEVC 啟用立體和 3D 視圖
NVIDIA 宣布在最新的 NVIDIA 視頻編解碼器 SDK 版本 13.0 中實施多視圖高效視頻編碼 (MV-HEVC) 編碼器。
2 MIN READ

2025年 1月 6日
利用 NVIDIA Omniverse 空間流,在 XR 中體驗數字孿生技術
空間計算 體驗正在轉變我們與數據的交互方式,通過 擴展現實 (XR) 和 數字孿生 等技術連接物理和數字世界。
2 MIN READ

2024年 10月 24日
利用 NVIDIA Morpheus 加速警報分流和 LLM 代理強化安全運營中心
安全運營中心(SOC)分析師每天都會收到大量傳入的安全警報。為了確保其組織的持續安全,他們的任務是仔細檢查傳入的噪音,分揀出誤報,
1 MIN READ

2024年 10月 22日
多代理 AI 和 GPU 驅動的聲音轉文本技術創新
自動音頻字幕 (Automated Audio Captioning) 任務的核心是從音頻輸入中生成自然語言描述。鑒于輸入 (音頻) 和輸出…
2 MIN READ

2024年 10月 14日
AI 驅動模擬和數字孿生技術助力手術機器人技術創新發展
在手術室中集成機器人手術助手(RSAs)為外科醫生和患者的治療效果帶來了巨大的優勢。目前,
1 MIN READ
數據科學

2025年 7月 1日
適用于有效 FP8 訓練的按張量和按塊擴展策略
在本博文中,我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…
2 MIN READ

2025年 6月 27日
AI 分析護士觀察記錄以降低患者危險
研究人員開發了一款 AI 賦能的工具,可以分析護士的輪班筆記,從而比傳統方法更早地識別入院患者的健康狀況可能惡化或處于“崩潰”的邊緣…
1 MIN READ

2025年 6月 27日
如何在 Polars GPU 引擎中處理超過 VRAM 的數據
在量化金融、算法交易和欺詐檢測等高風險領域,數據從業者經常需要處理數百 GB 的數據,才能快速做出明智的決策。
1 MIN READ

2025年 6月 25日
提高嵌入模型準確性,實現定制化信息檢索
自定義嵌入模型對于有效的信息檢索至關重要,尤其是在處理法律文本、病歷或多輪客戶對話等特定領域的數據時。通用、
2 MIN READ

2025年 6月 25日
如何使用 NVIDIA NeMo 技能簡化復雜的 LLM 工作流程
改進 LLM 的典型方法涉及多個階段:合成數據生成 (SDG) 、通過監督式微調 (SFT) 或強化學習 (RL) 進行模型訓練以及模型評估。
4 MIN READ

2025年 6月 18日
NVIDIA 在制造和運營領域的 AI 應用:借助 NVIDIA CUDA-X 數據科學加速 ML 模型
從晶圓制造和電路探測到封裝芯片測試,NVIDIA 利用數據科學和機器學習來優化芯片制造和運營工作流程。這些階段會產生 TB 級的數據,
3 MIN READ

2025年 6月 18日
借助 NVIDIA NIM 推理微服務和 ITMonitron 實現實時 IT 事故檢測和情報
在當今快節奏的 IT 環境中,并非所有事件都始于明顯的警報。這些問題可能始于細微的分散信號、錯過的警報、悄無聲息的 SLO 漏洞,
2 MIN READ

2025年 6月 16日
人工智能致力于為法律領域帶來秩序
斯坦福大學的一個研究團隊開發了一個 LLM 系統,以減少官樣文章。 被稱為“System for Statutory Research”…
1 MIN READ