NVIDIA 技術博客
-
生成式人工智能/大語言模型NVIDIA?TensorRT-LLM?支持騰訊混元最新大語言模型?Hunyuan-A13B?推理加速
-
數據中心/云端在 Azure 上使用 Apache Spark 和 NVIDIA AI 進行無服務器分布式數據處理
-
生成式人工智能/大語言模型PDF 數據提取方法及其在信息檢索中的應用
-
機器人使用 NVIDIA Warp 和高斯拋物線法構建機器人心理模型
-
AI 平臺/部署了解 NCCL 調優以加速 GPU 之間的通信
最近

2025年 7月 27日
NVIDIA?TensorRT-LLM?支持騰訊混元最新大語言模型?Hunyuan-A13B?推理加速
騰訊混元 (Hunyuan) 最新大語言模型 Hunyuan-A13B 今日發布,NVIDIA TensorRT-LLM 作為全球領先的…
1 MIN READ

2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 進行無服務器分布式數據處理
將大量文本庫轉換為數字表示 (稱為嵌入) 的過程對于生成式 AI 至關重要。從語義搜索和推薦引擎到檢索增強生成 (RAG) ,
2 MIN READ

2025年 7月 23日
PDF 數據提取方法及其在信息檢索中的應用
PDF 是共享財務報告、研究論文、技術文檔和營銷材料等信息的常用文件格式之一。然而,在構建有效的檢索增強生成 (RAG) 系統時,
4 MIN READ

2025年 7月 22日
使用 NVIDIA Warp 和高斯拋物線法構建機器人心理模型
本文將探討構建物理世界的動態數字表示的光明方向,這一主題在近期研究中日益受到關注。我們引入了一種在機器人環境中構建數字孿生的方法,
1 MIN READ

2025年 7月 22日
了解 NCCL 調優以加速 GPU 之間的通信
NVIDIA 集合通信庫 (NCCL) 對于 AI 工作負載中的快速 GPU 到 GPU 通信至關重要,可使用各種優化和調優來提升性能。但是,
3 MIN READ

2025年 7月 22日
使用 NVIDIA NeMo 在一個周末內訓練一個具備推理能力的 LLM
您是否曾想構建自己的推理模型,但認為它過于復雜或需要大量資源?再想想。借助 NVIDIA 強大的工具和數據集,
4 MIN READ

2025年 7月 21日
傳統 RAG 與代理 RAG——AI 智能體如何通過動態知識實現更高智能
是否曾依賴不知道新高速公路旁路或道路突然關閉的舊 GPS?它可能會讓您到達目的地,但不是最有效或最準確的方式。
1 MIN READ

2025年 7月 21日
使用 NVIDIA ?Nsight Systems 分析 Ray 負載(verl)的性能
在大語言模型的強化學習訓練過程中,GPU 性能優化至關重要。隨著模型規模不斷擴大,
2 MIN READ
增強現實/虛擬現實

2025年 5月 18日
聚焦:Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 實現個性化的數字化美妝體驗
增強現實 (AR) 和 AI 通過提供從虛擬試用到 AI 驅動的造型推薦等超個性化體驗,正在徹底改變美妝和時尚行業。
1 MIN READ

2025年 5月 6日
借助 NVIDIA RTX PRO Blackwell 臺式機 GPU 實現 Rivian 新一代XR 設計
對于不斷突破 XR 界限的專業人士而言,打造身臨其境的高保真體驗始終充滿挑戰。在渲染大型數據集和驅動最新的超高分辨率高級 XR 頭顯設備時,
2 MIN READ

2025年 3月 5日
借助 NVIDIA Omniverse 將 AR 體驗串流到 Apple iPad
最近在 MWC 巴塞羅那宣布 ,開發者現在可以將使用 NVIDIA Omniverse 構建的增強現實(AR)體驗流式傳輸到 Apple…
1 MIN READ

2025年 2月 24日
在 NVIDIA 視頻編解碼器 SDK 13.0 中使用 MV-HEVC 啟用立體和 3D 視圖
NVIDIA 宣布在最新的 NVIDIA 視頻編解碼器 SDK 版本 13.0 中實施多視圖高效視頻編碼 (MV-HEVC) 編碼器。
2 MIN READ

2025年 1月 6日
利用 NVIDIA Omniverse 空間流,在 XR 中體驗數字孿生技術
空間計算 體驗正在轉變我們與數據的交互方式,通過 擴展現實 (XR) 和 數字孿生 等技術連接物理和數字世界。
2 MIN READ

2024年 10月 24日
利用 NVIDIA Morpheus 加速警報分流和 LLM 代理強化安全運營中心
安全運營中心(SOC)分析師每天都會收到大量傳入的安全警報。為了確保其組織的持續安全,他們的任務是仔細檢查傳入的噪音,分揀出誤報,
1 MIN READ

2024年 10月 22日
多代理 AI 和 GPU 驅動的聲音轉文本技術創新
自動音頻字幕 (Automated Audio Captioning) 任務的核心是從音頻輸入中生成自然語言描述。鑒于輸入 (音頻) 和輸出…
2 MIN READ

2024年 10月 14日
AI 驅動模擬和數字孿生技術助力手術機器人技術創新發展
在手術室中集成機器人手術助手(RSAs)為外科醫生和患者的治療效果帶來了巨大的優勢。目前,
1 MIN READ
數據科學

2025年 7月 18日
3 個 pandas 工作流在大型數據集上嚴重變慢,直到啟用了 GPU 加速
如果您使用 pandas,您可能已經撞到了墻壁。正是在這個時刻,您值得信賴的工作流程在處理較小的數據集時表現出色,在處理大型數據集時陷入停頓。
1 MIN READ

2025年 7月 17日
大規模特征工程:利用 NVIDIA CUDA-X 數據科學優化半導體制造的機器學習模型
在上一篇博文中,我們介紹了芯片制造和運營中的預測建模設置,重點介紹了數據集不平衡等常見挑戰,以及對更細致的評估指標的需求。
2 MIN READ

2025年 7月 11日
使用 NVIDIA Earth-2 預測兩周以上的天氣
能夠預測極端天氣事件至關重要,因為此類條件變得更加常見且更具破壞性。次季節性氣候預測 (預測未來兩周或兩周以上的天氣)…
2 MIN READ

2025年 7月 10日
從 TB 級到一站式解決方案:AI 驅動的氣候模型走向主流
在了解地球不斷變化的氣候的競賽中,速度和準確性至關重要。但當今使用最廣泛的氣候模擬器往往難以滿足需求:由于計算能力的限制,
2 MIN READ

2025年 7月 9日
為 NVIDIA CUDA 內核融合提供 Python 中缺失的構建模塊
CUB 和 Thrust 等 C++ 庫提供高級構建塊,使 NVIDIA CUDA 應用和庫開發者能夠編寫跨架構可移植的光速代碼。
2 MIN READ

2025年 7月 7日
提出一個維基百科規模的問題:如何利用數百萬 token 的實時推理使世界更加智能
現代 AI 應用越來越依賴于將龐大的參數數量與數百萬個令牌的上下文窗口相結合的模型。無論是經過數月對話的 AI 智能體、
3 MIN READ

2025年 7月 3日
RAPIDS 新增 GPU Polars 串流、統一 GNN API 和零代碼 ML 加速功能
RAPIDS 是一套用于 Python 數據科學的 NVIDIA CUDA-X 庫,發布了 25.06 版本,引入了令人興奮的新功能。
2 MIN READ

2025年 7月 1日
適用于有效 FP8 訓練的按張量和按塊擴展策略
在本博文中,我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…
2 MIN READ