DGX

2025年 6月 18日
搶先體驗 NVIDIA GB200 系統如何幫助 LMarena 構建評估 LLM 的模型
在 NVIDIA 和 Nebius 的幫助下,加州大學伯克利分校的 LMArena 可以更輕松地了解哪些大語言模型在特定任務中表現出色。
2 MIN READ

2025年 6月 11日
隆重推出 NVIDIA DGX 云 Lepton:面向開發者的統一 AI 平臺
AI 原生應用的時代已經到來。開發者正在構建先進的代理式 AI 和物理 AI 系統,但跨地區和 GPU 提供商進行擴展仍然是一項挑戰。
2 MIN READ

2025年 6月 3日
NVIDIA Base Command Manager 為 AI 集群管理提供免費的啟動程序
隨著 AI 和高性能計算 (HPC) 工作負載變得越來越常見和復雜,系統管理員和集群管理員是確保一切平穩運行的核心。他們的工作 (構建、
1 MIN READ

2025年 5月 22日
Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用戶門檻
NVIDIA 的大語言模型 (LLM) 推理速度創下了世界紀錄。在包含 400 億參數的 Llama 4 Maverick 模型 (…
3 MIN READ

2025年 4月 9日
斯坦福大學實驗室借助 NVIDIA DGX 云加速 RNA 折疊研究
斯坦福大學的 Das Lab 正在通過一種利用社區參與和加速計算的獨特方法,徹底改變 RNA 折疊研究。在 NVIDIA DGX 云 通過…
1 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍
在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下, 大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時,
3 MIN READ

2025年 3月 25日
借助 NVIDIA Mission Control 實現 AI 工廠自動化
DeepSeek-R1 等先進的 AI 模型證明,企業現在可以構建專用于自己的數據和專業知識的尖端 AI 模型。
2 MIN READ

2025年 3月 18日
借助 NVIDIA DGX 云基準測試衡量和提高 AI 工作負載性能
隨著 AI 功能的進步,了解硬件和軟件基礎架構選擇對工作負載性能的影響對于技術驗證和業務規劃都至關重要。
2 MIN READ

2025年 3月 18日
借助 NVIDIA DGX 云無服務器推理在云環境中無縫擴展人工智能
NVIDIA DGX Cloud Serverless Inference 是一種自動擴展 AI 推理解決方案,可實現快速可靠的應用部署。
3 MIN READ

2025年 2月 14日
使用 NVIDIA TensorRT-LLM 前瞻性解碼優化 Qwen2.5-Coder 吞吐量
專注于編碼的 大語言模型(LLMs) 已穩步應用于開發者工作流程。從配對編程到自我改進的 AI 智能體 ,這些模型可幫助開發者完成各種任務,
3 MIN READ

2024年 12月 18日
2024 年 NVIDIA 6G 開發者日的 5 大關鍵收獲
2024 年 NVIDIA 6G 開發者日讓 6G 研發社區成員共聚一堂 ,分享見解,并學習使用 NVIDIA 6G 研究工具的新方式。
3 MIN READ

2024年 11月 22日
聚焦:TCS 利用 NVIDIA 生成式 AI 將汽車軟件測試速度提高 2 倍
生成式 AI 正在改變汽車行業的各個方面,包括軟件開發、測試、用戶體驗、個性化和安全性。隨著汽車行業從機械驅動轉向軟件驅動,
2 MIN READ

2024年 11月 20日
使用 EMBark 加速大規模推薦系統嵌入式訓練優化
推薦系統是互聯網行業的核心,而高效地訓練這些系統對于各大公司來說是一個關鍵問題。大多數推薦系統是深度學習推薦模型(DLRMs),
2 MIN READ

2024年 10月 22日
多代理 AI 和 GPU 驅動的聲音轉文本技術創新
自動音頻字幕 (Automated Audio Captioning) 任務的核心是從音頻輸入中生成自然語言描述。鑒于輸入 (音頻) 和輸出…
2 MIN READ

2024年 4月 26日
使用張量并行技術進行自動駕駛感知模型訓練
由于采用了多攝像頭輸入和深度卷積骨干網絡,用于訓練自動駕駛感知模型的 GPU 內存占用很大。
3 MIN READ

2024年 4月 23日
借助 Union.ai 和 NVIDIA DGX 云實現 AI 工作流程的大眾化
GPU 最初專用于在電子游戲中渲染 3D 圖形,主要用于加速線性代數計算。如今,GPU 已成為 AI 革命的關鍵組成部分之一。 現在,
2 MIN READ