Emily Potyraj – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Wed, 26 Mar 2025 02:41:16 +0000 zh-CN hourly 1 196178272 借助 NVIDIA DGX 云基準測試衡量和提高 AI 工作負載性能 http://www.open-lab.net/zh-cn/blog/measure-and-improve-ai-workload-performance-with-nvidia-dgx-cloud-benchmarking/ Tue, 18 Mar 2025 02:35:56 +0000 http://www.open-lab.net/zh-cn/blog/?p=13275 Continued]]> 隨著 AI 功能的進步,了解硬件和軟件基礎架構選擇對工作負載性能的影響對于技術驗證和業務規劃都至關重要。組織需要一種更好的方法來評估現實世界中的端到端 AI 工作負載性能和總擁有成本,而不僅僅是比較原始 FLOPs 或每個 GPU 的每小時成本。實現出色的 AI 性能需要的不僅僅是強大的 GPU。它需要一個經過充分優化的平臺,包括基礎架構、軟件框架和應用級增強功能。 在評估 AI 性能時,請提出以下關鍵問題:您的實現是否正確,或者是否存在與參考架構相比減慢您速度的錯誤?集群的最佳規模是什么?選擇哪些軟件框架可以縮短上市時間?傳統的芯片級指標不足以完成這項任務,導致投資未得到充分利用,并且錯過了效率提升。衡量 AI 工作負載和基礎設施的性能至關重要。 本文將介紹 NVIDIA DGX 云基準測試,這是一套工具,用于評估跨 AI 工作負載和平臺的訓練和推理性能,其中包括基礎設施軟件、

Source

]]>
13275
NVIDIA DGX 云推出即用型模板,更好地評估 AI 平臺性能 http://www.open-lab.net/zh-cn/blog/nvidia-dgx-cloud-introduces-ready-to-use-templates-to-benchmark-ai-platform-performance/ Tue, 11 Feb 2025 03:20:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=12847 Continued]]> 在快速發展的 AI 系統和工作負載環境中,實現出色的模型訓練性能遠遠超出芯片速度。這需要對整個堆棧進行全面評估,從計算到網絡,再到模型框架。 了解復雜的 AI 系統性能可能比較困難。從精度到并行,您可以對許多應用程序進行更改,但目前需要付出大量努力和掌握專業知識才能有效實施這些更改。 NVIDIA DGX Cloud Benchmarking Recipes 為提高訓練性能提供了指導,通過分享每個工作負載的良好性能以及實現方法的最佳實踐。 如需了解更多信息,請參閱 NVIDIA DGX Cloud Benchmarking Recipes 。 DGX 云 Benchmarking Recipes 是一款端到端基準測試套件,既可以衡量真實環境中的性能,也可以識別 AI 訓練工作負載中的優化機會。這些基準測試方法經過精心設計,可評估真實 AI 應用的性能,

Source

]]>
12847
借助 NVIDIA Base Command Platform 簡化作業初始化和基于 CPU 的任務 http://www.open-lab.net/zh-cn/blog/streamline-job-initialization-and-cpu-based-tasks-with-nvidia-base-command-platform/ Wed, 29 Nov 2023 06:12:57 +0000 http://www.open-lab.net/zh-cn/blog/?p=8349 Continued]]> NVIDIA Base Command 平臺 提供了日益精簡的軟件服務工作流程,旨在加速 AI 開發。本文將介紹近期添加的一些新功能,包括: 在超級計算機上啟動探索環境從未如此簡單。 借助“Quick Start”(快速啟動)功能,團隊可以以編程方式定義其常用配置,從 GPU 和 CPU 實例類型、內存和存儲需求到添加數據集、工作空間、交換容器,甚至設置默認命令。這些都定義為一個模板,只需在 Base Command 控制面板中單擊一下即可啟動。 除了自己構建模板外,您還可以利用 NVIDIA 構建的快速入門目錄。JupyterLab 和 Dask+RAPIDS 的默認快速入門現已推出。隨著目錄的不斷發展,數據科學家現在使用的各種工具集將更易于使用 GPU 加速的數據科學。 軟件和硬件的深度集成是 Base Command Platform 的核心原則,

Source

]]>
8349
人人超碰97caoporen国产