硬件/半導體

2025年 7月 7日
提出一個維基百科規模的問題:如何利用數百萬 token 的實時推理使世界更加智能
現代 AI 應用越來越依賴于將龐大的參數數量與數百萬個令牌的上下文窗口相結合的模型。無論是經過數月對話的 AI 智能體、
3 MIN READ

2025年 6月 18日
搶先體驗 NVIDIA GB200 系統如何幫助 LMarena 構建評估 LLM 的模型
在 NVIDIA 和 Nebius 的幫助下,加州大學伯克利分校的 LMArena 可以更輕松地了解哪些大語言模型在特定任務中表現出色。
2 MIN READ

2025年 6月 2日
使用外部文件上傳在 NVIDIA Air 中構建可擴展且自定義網絡拓撲的優勢
NVIDIA Air 具有仿真從小型網絡到整個數據中心的任何網絡的獨特能力。在開始配置、路由或管理之前,請先考慮拓撲。
1 MIN READ

2025年 5月 18日
借助 NVIDIA NVLink Fusion 將半定制計算平臺集成到機架級架構
為了高效應對 AI 工作負載,數據中心正在被重構。這是一項非常復雜的工作,因此,
2 MIN READ

2025年 5月 13日
使用 NVIDIA Air 服務將仿真與現實世界連接
NVIDIA Air 通過創建與真實數據中心基礎設施部署相同的副本來實現云規模效率。借助 NVIDIA Air,
1 MIN READ

2025年 5月 6日
NVIDIA NV-Tesseract 新一代時間序列模型助力數據集處理和異常檢測的突破性進展
時間序列數據已從簡單的歷史記錄演變為跨行業關鍵決策的實時引擎。無論是簡化物流、預測市場,還是預測機器故障,
1 MIN READ

2025年 4月 23日
NVIDIA Secure AI 正式發布
隨著許多企業開始對其數據進行 AI 訓練或推理,需要保護數據和代碼,尤其是大語言模型 (LLMs) 。由于數據敏感性,
1 MIN READ

2025年 4月 11日
AI Fabric 的彈性以及網絡融合的重要性
高性能計算和深度學習工作負載對延遲極為敏感。數據包丟失會導致通信管道中的重傳或停頓,從而直接增加延遲并中斷 GPU 之間的同步。
1 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍
在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下, 大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時,
3 MIN READ

2025年 3月 19日
AI 推理時代的 NVIDIA Blackwell Ultra
多年來,AI 的進步一直通過預訓練擴展遵循清晰的軌跡:更大的模型、更多的數據和更豐富的計算資源帶來了突破性的功能。在過去 5 年中,
2 MIN READ

2025年 2月 6日
適用于數據科學的 GPU 加速入門
在數據科學領域,運營效率是處理日益復雜和大型數據集的關鍵。GPU 加速已成為現代工作流程的關鍵,可顯著提高性能。
3 MIN READ

2025年 2月 4日
NVIDIA Spectrum-X 網絡平臺和合作伙伴提升 AI 存儲性能達48%
AI 工廠依靠的不僅僅是計算網。當然,連接 GPU 的東西向網絡對于 AI 應用的性能至關重要,而連接高速存儲陣列的存儲網也不容忽視。
1 MIN READ

2025年 1月 30日
為 NVIDIA Blackwell GeForce RTX 50 系列 GPU 發布全新 AI SDK 和工具
NVIDIA 最近宣布推出 新一代 PC GPU – GeForce RTX 50 系列 ,以及面向開發者的全新 AI 賦能 SDK 和工具。
2 MIN READ

2024年 12月 12日
NVIDIA Air 簡要介紹
AI 的出現帶來了一種新型數據中心,即 AI 工廠 ,專門用于處理 AI 工作負載。AI 工作負載的范圍和規模可能會有很大差異,
2 MIN READ

2024年 11月 14日
探索采用自主 AI 和 NVIDIA 機密計算的超級協議案例
機密和自主的 AI 是一種新的 AI 開發、訓練和推理方法,其中用戶的數據是去中心化的、私有的,并由用戶自己控制。
3 MIN READ

2024年 10月 29日
在 SONiC 中通過安全啟動保護您的網絡
NVIDIA 技術可幫助組織構建和維護安全、可擴展和高性能的網絡基礎設施。
1 MIN READ