云服務

2025年 5月 22日
Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用戶門檻
NVIDIA 的大語言模型 (LLM) 推理速度創下了世界紀錄。在包含 400 億參數的 Llama 4 Maverick 模型 (…
3 MIN READ

2025年 5月 18日
宣布推出適用于基準測試 AI 云基礎設施的 NVIDIA 示例云
長期以來,在云端訓練 大語言模型 (LLMs) 和部署 AI 工作負載的開發者和企業一直面臨著一項根本性挑戰:
1 MIN READ

2025年 5月 15日
使用 NVIDIA CUDA-X 和 Coiled 簡化云端環境設置并加速數據科學運算
想象一下,分析紐約市數百萬次的拼車旅程 — — 跟蹤各自治市的模式、比較服務定價或確定有利可圖的取車地點。
4 MIN READ

2025年 5月 14日
借助 NVIDIA Nemo 框架,在遠程數據中心網絡中加速 LLM 訓練
多數據中心訓練對 AI 工廠至關重要,因為預訓練擴展會推動更大模型的創建,導致對計算性能的需求超過單個設施的能力。
2 MIN READ

2025年 5月 13日
使用 NVIDIA Air 服務將模擬與現實世界連接
NVIDIA Air 通過創建真實數據中心基礎設施部署的相同副本來實現云規模效率。借助 NVIDIA Air,您可以啟動數百臺交換機和服務器,
2 MIN READ

2025年 4月 23日
聚焦:Qodo 借助 NVIDIA DGX 實現高效代碼搜索創新
大語言模型 (LLMs) 使 AI 工具能夠幫助您更快地編寫更多代碼,但隨著我們要求這些工具承擔越來越復雜的任務,其局限性變得顯而易見。
3 MIN READ

2025年 4月 2日
LLM 基準測試:基本概念
在過去幾年中,作為廣泛的 AI 革命的一部分, 生成式 AI 和 大語言模型 (LLMs) 越來越受歡迎。
4 MIN READ

2025年 3月 31日
Volcano 調度程序中防止 GPU 碎片的實用技巧
在 NVIDIA,我們以精準和創新解決復雜的基礎設施挑戰為豪。當 Volcano 在其 NVIDIA DGX 云調配的 Kubernetes…
3 MIN READ

2025年 3月 26日
聚焦:Tomorrow.io 借助 NVIDIA AI 改變全球天氣恢復能力
從指導日常運營的超本地化預測,到啟發新氣候見解的行星級模型,世界正在進入天氣和氣候適應能力的新前沿。
2 MIN READ

2025年 3月 18日
NVIDIA Blackwell 實現世界紀錄的 DeepSeek-R1 推理性能
NVIDIA 在 NVIDIA GTC 2025 上宣布了創下世界紀錄的 DeepSeek-R1 推理性能 。 搭載 8 個 NVIDIA…
5 MIN READ

2025年 3月 18日
在 NVIDIA DGX 云上使用 NVIDIA NeMo Curator 處理 PB 級視頻
隨著 物理 AI 的興起,視頻內容生成呈指數級增長。一輛配備攝像頭的自動駕駛汽車每天可生成超過 1 TB 的視頻,
3 MIN READ

2025年 3月 18日
借助 NVIDIA DGX 云基準測試衡量和提高 AI 工作負載性能
隨著 AI 功能的進步,了解硬件和軟件基礎架構選擇對工作負載性能的影響對于技術驗證和業務規劃都至關重要。
2 MIN READ

2025年 2月 11日
NVIDIA DGX 云推出即用型模板,更好地評估 AI 平臺性能
在快速發展的 AI 系統和工作負載環境中,實現出色的模型訓練性能遠遠超出芯片速度。這需要對整個堆棧進行全面評估,從計算到網絡,再到模型框架。
2 MIN READ

2025年 2月 5日
NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可編程性
矩陣乘法和注意力機制是現代 AI 工作負載的計算支柱。雖然庫如 NVIDIA cuDNN 提供高度優化的實現,
2 MIN READ

2025年 1月 31日
NVIDIA 集合通信庫 2.23 促使新的縮放算法和初始化方法的誕生
NVIDIA 集合通信庫 (NCCL) 可實現針對 NVIDIA GPU 和網絡進行優化的多 GPU 和多節點通信基元。
2 MIN READ

2025年 1月 13日
借助 NVIDIA DOCA 平臺框架,助力新一代 DPU 加速云基礎設施
越來越多的企業組織開始采用加速計算來滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 發布了 DOCA 平臺框架 (DPF),
2 MIN READ