基準

2023年 5月 15日
使用 Alpa 和 Ray 在大型 GPU 集群中高效擴展 LLM 訓練
近年來,大型語言模型( LLM )的數量激增,它們超越了傳統的語言任務,擴展到生成式人工智能這包括像 ChatGPT 和 Stable…
4 MIN READ

2023年 5月 5日
使用 VMware vSphere 8 和 NVIDIA BlueField DPU 加速 Redis 性能
向現代分布式工作負載的轉變,以及更高的網絡速度,增加了基礎設施服務的開銷。為企業提供動力的應用程序可用的 CPU 周期較少。部署數據處理器(…
3 MIN READ

2023年 4月 18日
新的 GPU 庫降低了 Apache Spark ML 的計算成本
Spark MLlib是Apache Spark用于大規模machine learning并且提供了許多流行的機器學習算法的內置實現。
2 MIN READ

2023年 4月 18日
使用 NVIDIA Isaac ROS 開發人員預覽版 3 構建高性能機器人應用程序
機器人的復雜性正在增加,具有更高的自主性、更多的傳感器數量和多樣性,以及更多基于傳感器融合的算法。
2 MIN READ

2023年 4月 5日
通過 AI 的全棧優化在 MLPerf 推理 v3.0 中創下新紀錄
目前最令人興奮的計算應用程序依賴于在復雜的人工智能模型上進行訓練和運行推理,通常是在要求苛刻的實時部署場景中。需要高性能、
5 MIN READ

2023年 2月 9日
通過 GROMACS 大幅提高多節點 NVIDIA GPU 的可擴展性
GROMACS 是一種廣泛用于模擬生物分子系統的科學軟件包,在理解對疾病預防和治療重要的重要生物學過程中發揮著至關重要的作用。
3 MIN READ

2023年 2月 2日
針對 NVIDIA GPU 的低延遲交易和快速回測的深度神經網絡基準
降低對新市場事件的響應時間是算法交易的一個驅動力。對延遲敏感的交易公司通過在其系統中部署諸如現場可編程門陣列( FPGA )和專用集成電路(…
2 MIN READ

2022年 11月 9日
領先的 MLPerf Training 2.1 ,具有針對 AI 的全棧優化
MLCommons 開發的 MLPerf 基準是組織衡量其機器學習模型跨工作負載培訓性能的關鍵評估工具。
4 MIN READ

2022年 6月 30日
為 NVIDIA MLPerf Training v2.0 性能提供動力的全堆棧優化
MLPerf benchmarks 由工業界、學術界和研究實驗室的人工智能領導者組成的聯盟開發,旨在提供標準、公平和有用的深度學習性能測量。
4 MIN READ

2022年 6月 1日
通過全棧創新推動高性能計算
高性能計算(HPC)已成為科學發現的基本工具。 無論是發現新的拯救生命的藥物,對抗氣候變化,還是創建精確的世界模擬,
3 MIN READ

2022年 4月 6日
在 MLPerf 推理 2.0 上獲得最佳性能
Megatron 530B 等機型正在擴大人工智能可以解決的問題范圍。然而,隨著模型的復雜性不斷增加,它們對人工智能計算平臺構成了雙重挑戰:
4 MIN READ

2022年 3月 1日
使用最新的由 NVIDIA 驅動的實例,在云端節省時間和金錢
人工智能正在改變每一個行業,實現傳統軟件無法實現的強大的新應用程序和用例。隨著人工智能的不斷擴散,以及人工智能模型的規模和復雜性的不斷增加,
4 MIN READ

2021年 12月 1日
通過全堆棧優化提升 NVIDIA MLPerf Training v1.1 的性能
自 v1.0 以來已經過去了五個月,所以是時候進行新一輪 MLPerf 培訓基準了。在這個 v1.1 版本中,
5 MIN READ