AI 平臺/部署

2025年 5月 21日
NVIDIA Dynamo 加速 llm-d 社區計劃,推動大規模分布式推理
在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。
1 MIN READ

2025年 5月 19日
NVIDIA TensorRT for RTX 在 Windows 11 上推出優化的推理 AI 庫
在 Windows 上,創意、游戲和生產力應用方面的 AI 體驗正在迅速擴展。有各種框架可用于在臺式機、
3 MIN READ

2025年 5月 18日
NVIDIA ConnectX-8 SuperNIC 通過 PCIe Gen6 連接推動 AI 平臺架構發展
從 大語言模型 (LLM) 到 代理式 AI 推理和 物理 AI ,隨著 AI 工作負載的復雜性和規模不斷增加,人們對更快、
2 MIN READ

2025年 5月 18日
借助 NVIDIA NVLink Fusion 將半自定義計算集成到機架級架構中
數據中心正在重新構建,以高效交付 AI 工作負載。這是一項非常復雜的工作,NVIDIA 目前正在提供基于 NVIDIA 機架級架構的 AI…
2 MIN READ

2025年 5月 18日
使用 OpenUSD 和 SimReady 資產構建 AI 工廠
適用于 AI 工廠 數字孿生的 NVIDIA Omniverse Blueprint 在 COMPUTEX 2025 上發布 ,
1 MIN READ

2025年 5月 18日
宣布推出適用于基準測試 AI 云基礎設施的 NVIDIA 示例云
長期以來,在云端訓練 大語言模型 (LLMs) 和部署 AI 工作負載的開發者和企業一直面臨著一項根本性挑戰:
1 MIN READ

2025年 5月 15日
使用 cuEmbed 加速嵌入查找
NVIDIA 最近發布了 cuEmbed,這是一個高性能、僅使用標頭的 CUDA 庫,可加速 NVIDIA GPU 上的嵌入查找。
2 MIN READ

2025年 5月 14日
光輪智能利用 NVIDIA GR00T N1 人形機器人模型落地汽車工廠生產應用
光輪智能成功將 NVIDIA GR00T N1 人形機器人基礎模型部署至汽車制造生產線,
1 MIN READ

2025年 4月 29日
選擇您的第一個本地人工智能項目
AI 正迅速超越集中式云和數據中心,成為可直接部署在專業工作站上的強大工具。借助先進的硬件和優化的軟件,您可以在桌面上或隨時隨地構建、
2 MIN READ

2025年 4月 24日
使用 NVIDIA NIM 對游戲進行代理式 LLM 和 VLM 推理基準測試
這是 LLM 基準測試系列的第一篇文章,介紹了在使用 NVIDIA NIM 部署 Meta Llama 3 模型時,
2 MIN READ

2025年 4月 21日
使用 NVIDIA TensorRT 優化基于 Transformer 的擴散模型以生成視頻
先進的圖像擴散模型需要數十秒才能處理單張圖像。這使得視頻擴散更具挑戰性,需要大量計算資源和高昂成本。
4 MIN READ

2025年 4月 17日
在 NVIDIA OptiX 中使用協作向量實現神經渲染
NVIDIA OptiX 9.0 的發布引入了一項名為 Cooperative Vectors 的新功能,
4 MIN READ

2025年 4月 16日
使用 NVIDIA NIM 構建 AI 驅動的自動引用驗證工具
引文的準確性對于保持學術和 AI 生成內容的完整性至關重要。當引用不準確或錯誤時,它們可能會誤導讀者并散布虛假信息。
2 MIN READ

2025年 4月 15日
NVIDIA Llama Nemotron 超開放模型實現突破性的推理準確性
AI 不再只是生成文本或圖像,而是要針對商業、金融、客戶和醫療健康服務中的現實應用進行深度推理、詳細解決問題并實現強大的適應性。
2 MIN READ

2025年 4月 9日
借助 Rafay 為企業 AI 工作負載提供 NVIDIA 加速計算
生成式 AI 在全球的應用推動了全球對加速計算硬件的巨大需求。在企業中,這加快了加速私有云基礎設施的部署。在地區層面,
2 MIN READ

2025年 4月 1日
NVIDIA 開源 Run:ai 調度程序以推動社區協作
今天,NVIDIA 宣布推出 KAI Scheduler 的開源版本,這是一種 Kubernetes-native GPU 調度解決方案,
3 MIN READ