AI 平臺/部署

2025年 5月 21日

NVIDIA Dynamo 加速 llm-d 社區計劃，推動大規模分布式推理

在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。

1 MIN READ

2025年 5月 19日

NVIDIA TensorRT for RTX 在 Windows 11 上推出優化的推理 AI 庫

在 Windows 上，創意、游戲和生產力應用方面的 AI 體驗正在迅速擴展。有各種框架可用于在臺式機、

3 MIN READ

2025年 5月 18日

NVIDIA ConnectX-8 SuperNIC 通過 PCIe Gen6 連接推動 AI 平臺架構發展

從大語言模型 (LLM) 到代理式 AI 推理和物理 AI ，隨著 AI 工作負載的復雜性和規模不斷增加，人們對更快、

2 MIN READ

2025年 5月 18日

借助 NVIDIA NVLink Fusion 將半自定義計算集成到機架級架構中

數據中心正在重新構建，以高效交付 AI 工作負載。這是一項非常復雜的工作，NVIDIA 目前正在提供基于 NVIDIA 機架級架構的 AI…

2 MIN READ

2025年 5月 18日

使用 OpenUSD 和 SimReady 資產構建 AI 工廠

適用于 AI 工廠數字孿生的 NVIDIA Omniverse Blueprint 在 COMPUTEX 2025 上發布，

1 MIN READ

2025年 5月 18日

宣布推出適用于基準測試 AI 云基礎設施的 NVIDIA 示例云

長期以來，在云端訓練大語言模型 (LLMs) 和部署 AI 工作負載的開發者和企業一直面臨著一項根本性挑戰：

1 MIN READ

2025年 5月 15日

使用 cuEmbed 加速嵌入查找

NVIDIA 最近發布了 cuEmbed，這是一個高性能、僅使用標頭的 CUDA 庫，可加速 NVIDIA GPU 上的嵌入查找。

2 MIN READ

2025年 5月 14日

光輪智能利用 NVIDIA GR00T N1 人形機器人模型落地汽車工廠生產應用

光輪智能成功將 NVIDIA GR00T N1 人形機器人基礎模型部署至汽車制造生產線，

1 MIN READ

2025年 4月 29日

選擇您的第一個本地人工智能項目

AI 正迅速超越集中式云和數據中心，成為可直接部署在專業工作站上的強大工具。借助先進的硬件和優化的軟件，您可以在桌面上或隨時隨地構建、

2 MIN READ

2025年 4月 24日

使用 NVIDIA NIM 對游戲進行代理式 LLM 和 VLM 推理基準測試

這是 LLM 基準測試系列的第一篇文章，介紹了在使用 NVIDIA NIM 部署 Meta Llama 3 模型時，

2 MIN READ

2025年 4月 21日

使用 NVIDIA TensorRT 優化基于 Transformer 的擴散模型以生成視頻

先進的圖像擴散模型需要數十秒才能處理單張圖像。這使得視頻擴散更具挑戰性，需要大量計算資源和高昂成本。

4 MIN READ

2025年 4月 17日

在 NVIDIA OptiX 中使用協作向量實現神經渲染

NVIDIA OptiX 9.0 的發布引入了一項名為 Cooperative Vectors 的新功能，

4 MIN READ

2025年 4月 16日

使用 NVIDIA NIM 構建 AI 驅動的自動引用驗證工具

引文的準確性對于保持學術和 AI 生成內容的完整性至關重要。當引用不準確或錯誤時，它們可能會誤導讀者并散布虛假信息。

2 MIN READ

2025年 4月 15日

NVIDIA Llama Nemotron 超開放模型實現突破性的推理準確性

AI 不再只是生成文本或圖像，而是要針對商業、金融、客戶和醫療健康服務中的現實應用進行深度推理、詳細解決問題并實現強大的適應性。

2 MIN READ

2025年 4月 9日

借助 Rafay 為企業 AI 工作負載提供 NVIDIA 加速計算

生成式 AI 在全球的應用推動了全球對加速計算硬件的巨大需求。在企業中，這加快了加速私有云基礎設施的部署。在地區層面，

2 MIN READ

2025年 4月 1日

NVIDIA 開源 Run:ai 調度程序以推動社區協作

今天，NVIDIA 宣布推出 KAI Scheduler 的開源版本，這是一種 Kubernetes-native GPU 調度解決方案，

3 MIN READ