DOCA – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Fri, 04 Jul 2025 02:57:26 +0000
zh-CN
hourly
1
196178272 -
NVIDIA DOCA 3.0 助力 AI 平臺開啟網絡新紀元
http://www.open-lab.net/zh-cn/blog/powering-the-next-frontier-of-networking-for-ai-platforms-with-nvidia-doca-3-0/
Wed, 25 Jun 2025 04:24:05 +0000
http://www.open-lab.net/zh-cn/blog/?p=14474
Continued]]>
NVIDIA DOCA 框架已發展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發布,每個版本都擴展了 NVIDIA BlueField DPU 和 ConnectX SuperNIC 的功能,從而實現了前所未有的 AI 平臺可擴展性和性能。 通過豐富的庫和服務生態系統, DOCA充分利用 BlueField DPU 和 SuperNIC,實現了在超過 10 萬個 GPU 上的超大規模部署,同時保持嚴格的租戶隔離并優化資源利用率。DOCA 的安全功能可為容器化 AI 工作負載提供硬件級威脅檢測,而不會對性能造成影響。DOCA 的智能數據加速功能解決了 AI 數據流水線中的關鍵瓶頸,而其編排功能則簡化了復雜的 DPU 加速服務部署。 本文將介紹 DOCA 3.0,它代表了這些進步的最終成果。DOCA 3.0…
Source
]]>
14474
-
NVIDIA 集合通信庫 2.26 實現性能和監控功能的提升
http://www.open-lab.net/zh-cn/blog/improved-performance-and-monitoring-capabilities-with-nvidia-collective-communications-library-2-26/
Wed, 18 Jun 2025 04:35:29 +0000
http://www.open-lab.net/zh-cn/blog/?p=14370
Continued]]>
NVIDIA 集合通信庫 (NCCL) 可實現針對 NVIDIA GPU 和網絡優化的多 GPU 和多節點通信基元。NCCL 是用于多 GPU 深度學習訓練的核心軟件。它可以處理任何類型的 GPU 間通信,無論是通過 PCI、NVIDIA NVLink 還是網絡。它使用先進的拓撲檢測、優化的通信圖形和調優模型,在 NVIDIA GPU 平臺上直接獲得出色性能。 在本文中,我們將討論 NCCL 2.26 中發布的新功能和修復。有關更多詳情,請訪問 NVIDIA/nccl GitHub 資源庫。請注意,NCCL 2.25 版本僅側重于 NVIDIA Blackwell 平臺支持,沒有庫功能更改。因此,尚未發布該版本的發布文章。 NVIDIA Magnum IO NCCL 是一個旨在優化 GPU 間和多節點通信的庫,對于 AI 和 HPC 應用中的高效并行計算至關重要。
Source
]]>
14370
-
NVIDIA Spectrum-X 網絡平臺和合作伙伴提升 AI 存儲性能達48%
http://www.open-lab.net/zh-cn/blog/accelerating-ai-storage-by-up-to-48-with-nvidia-spectrum-x-networking-platform-and-partners/
Tue, 04 Feb 2025 06:56:25 +0000
http://www.open-lab.net/zh-cn/blog/?p=12761
Continued]]>
AI 工廠依靠的不僅僅是計算網。當然,連接 GPU 的東西向網絡對于 AI 應用的性能至關重要,而連接高速存儲陣列的存儲網也不容忽視。存儲性能在運行 AI 業務過程中的多個階段中發揮著關鍵作用, 包括訓練過程中的Checkpoint操作、 推理過程中的檢索增強生成 (RAG) 等。 為了滿足這些需求,NVIDIA 和存儲生態合作伙伴正在將 NVIDIA Spectrum-X 網絡平臺 擴展到數據存儲網,從而帶來更高的性能和更快的實現AI的時間。由于 Spectrum-X 動態路由技術能夠緩解網絡中的流量沖突并增加有效帶寬,從而使存儲性能遠高于 RoCE v2,RoCE v2是大多數數據中心用于 AI 計算網和存儲網的以太網網絡協議。 Spectrum-X 將讀取帶寬加速了高達 48%,寫入帶寬加速了高達 41%。帶寬的增加可以更快地完成 AI 工作流中與存儲相關的操作,
Source
]]>
12761
-
借助 NVIDIA DOCA 平臺框架,助力新一代 DPU 加速云基礎設施
http://www.open-lab.net/zh-cn/blog/powering-the-next-wave-of-dpu-accelerated-cloud-infrastructures-with-nvidia-doca-platform-framework/
Mon, 13 Jan 2025 08:06:11 +0000
http://www.open-lab.net/zh-cn/blog/?p=12623
Continued]]>
越來越多的企業組織開始采用加速計算來滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 發布了 DOCA 平臺框架 (DPF),該框架提供了基礎構建塊來釋放 NVIDIA BlueField DPU 的強大功能,并優化 GPU 加速的計算平臺。作為一種編排框架和實施藍圖,DPF 使開發者、服務提供商和企業能夠無縫創建 BlueField 加速的云原生軟件平臺。 通過簡化 DPU 調配、生命周期管理和服務編排,DPF 使 BlueField DPU 可在 Kubernetes 環境中廣泛使用,以加速 AI 和其他現代工作負載。此外,DPF 還強化了由 BlueField 加速的應用和服務組成的生態系統,推動可擴展云平臺的發展。 NVIDIA 對 CPU-GPU-DPU 三功能的承諾眾所周知,隨著 DPF 的推出,NVIDIA 正在此架構的 DPU 方面實現大膽的飛躍。
Source
]]>
12623
-
NVIDIA BlueField DPU 與 WEKA Client 的集成提升 AI 工作負載效率
http://www.open-lab.net/zh-cn/blog/integration-of-nvidia-bluefield-dpus-with-weka-client-boosts-ai-workload-efficiency/
Thu, 12 Dec 2024 05:51:34 +0000
http://www.open-lab.net/zh-cn/blog/?p=12353
Continued]]>
WEKA 是可擴展軟件定義數據平臺的先驅,NVIDIA 正在攜手合作,將 WEKA 的先進數據平臺解決方案與功能強大的 NVIDIA BlueField DPU 相結合。 WEKA 數據平臺高級存儲軟件可充分發揮 AI 和性能密集型工作負載的潛力,而 NVIDIA BlueField DPU 則徹底改變了數據的訪問、移動和安全性。這些前沿技術的集成將開創數據管理效率和速度前所未有的新時代,并有望重塑高性能數據訪問的格局。 AI 的迅速崛起推動了計算能力和網絡速度的指數級增長,對存儲資源提出了非常高的需求。NVIDIA GPU 可提供令人驚嘆的可擴展、高效計算能力,同時還需要高速數據訪問。 WEKA 與 NVIDIA 的合作應對了這一挑戰。它們共同滿足了對 PB 級數據進行高帶寬網絡訪問以執行模型訓練和推理任務 (包括 檢索增強型生成 (RAG)) 的關鍵需求。
Source
]]>
12353
-
NVIDIA DOCA 2.9 借助新性能和安全功能強化人工智能和云計算基礎設施
http://www.open-lab.net/zh-cn/blog/nvidia-doca-2-9-enhances-ai-and-cloud-computing-infrastructure-with-new-performance-and-security-features/
Thu, 14 Nov 2024 07:22:47 +0000
http://www.open-lab.net/zh-cn/blog/?p=12041
Continued]]>
NVIDIA DOCA 通過為開發者提供全面的軟件框架來利用硬件加速來增強 NVIDIA 網絡平臺的功能,從而提高性能、安全性和效率。它的 API、庫和工具生態系統可簡化數據中心基礎設施的開發,實現工作負載卸載、加速和隔離,以支持現代、高效的數據中心。 如今,許多主要的 CSP 和 NVIDIA 云合作伙伴(NCP)都在使用 DOCA,并為快速開發和部署創新解決方案提供了標準化平臺。這種方法可縮短上市時間、降低成本,并使合作伙伴能夠在使用 NVIDIA 硬件加速的同時專注于自身的核心優勢。 DOCA 培育的開放生態系統促進了協作和互操作性,創造了各種互補解決方案。合作伙伴可以探索 AI 驅動的網絡、高級安全性和高性能存儲等新興市場,將自己定位在數據中心創新前沿。 DOCA 2.9 的最新版本標志著 AI 計算結構和云計算基礎設施的重大進步。這次全面更新引入了許多新功能和改進,
Source
]]>
12041
-
借助 NVIDIA DOCA-OFED 讓您的網絡堆棧面向未來
http://www.open-lab.net/zh-cn/blog/future-proof-your-networking-stack-with-nvidia-doca-ofed/
Tue, 15 Oct 2024 04:33:41 +0000
http://www.open-lab.net/zh-cn/blog/?p=11672
Continued]]>
NVIDIA DOCA 軟件平臺 釋放了 NVIDIA BlueField 網絡平臺 的潛力,并為 NVIDIA BlueField 和 ConnectX 設備提供了所需的所有主機驅動程序。DOCA 針對峰值性能進行了優化,使用戶能夠滿足日益復雜的工作負載的需求。其模塊化結構提供了適應新興技術和更高數據吞吐量所需的靈活性。 在最近發布的網絡軟件版本中,NVIDIA 從 MLNX_OFED 驅動和工具套件(適用于 InfiniBand 和 Ethernet 解決方案)過渡到 DOCA-OFED ,標志著獨立 MLNX_OFED 版本的結束。這一轉變反映了向集成在 NVIDIA DOCA 框架中的更加統一、可擴展和可編程的網絡堆棧的轉變。MLNX_OFED 的輕量級子集 MLNX_EN 的最終版本也將發布,未來功能將只能通過 DOCA 訪問。
Source
]]>
11672
-
使用 NVIDIA DOCA GPUNetIO 解鎖 GPU 加速的 RDMA
http://www.open-lab.net/zh-cn/blog/unlocking-gpu-accelerated-rdma-with-nvidia-doca-gpunetio/
Thu, 13 Jun 2024 09:21:03 +0000
http://www.open-lab.net/zh-cn/blog/?p=10482
Continued]]>
NVIDIA DOCA GPUNetIO是 NVIDIA DOCA SDK 中的一個庫,專門為實時內聯 GPU 數據包處理而設計。它結合了GPUDirect RDMA和GPUDirect Async等技術,能夠創建以 GPU 為中心的應用程序,其中 CUDA 內核可以直接與網絡接口卡(NIC)通信,用于發送和接收數據包,繞過 CPU 并將其排除在關鍵路徑之外。 DOCA GPUNetIO 的核心原理和用途已在前幾篇文章《Inline GPU Packet Processing with NVIDIA DOCA GPUNetIO》和《Realizing the Power of Real-Time Network Processing with NVIDIA DOCA GPUNetIO》以及DOCA GPUNetIO 編程指南中進行了討論。 此前,
Source
]]>
10482
-
借助 NVIDIA DOCA 2.7 增強 AI 云數據中心和 NVIDIA Spectrum-X
http://www.open-lab.net/zh-cn/blog/enhancing-ai-cloud-data-centers-and-nvidia-spectrum-x-with-nvidia-doca-2-7/
Thu, 23 May 2024 04:51:03 +0000
http://www.open-lab.net/zh-cn/blog/?p=10093
Continued]]>
我們通過 NVIDIA DOCA 加速框架,為開發者提供了豐富的庫、驅動和 API,以創建高性能應用程序和服務,支持 NVIDIA BlueField 數據處理器 (DPU) 和 SuperNIC。DOCA 2.7 是一個功能豐富的全面版本,進一步擴展了 DOCA 軟件框架的范圍和價值,提供了多個新的庫、一站式應用和功能齊全的服務。 DOCA 2.7 擴展了 BlueField DPU 在數據中心內卸載、加速和隔離網絡、存儲、安全和管理基礎設施方面的能力。該版本還進一步增強了 AI 云數據中心,并通過 NVIDIA Spectrum-X 網絡平臺,為 AI 工作負載提供了卓越的性能。 本文中詳細介紹的版本亮點包括: DOCA 2.7 為以太網 AI 云部署啟用 NVIDIA Spectrum-X 1.0.1 (SPC-X 1.0.1) 參考架構。此架構經過嚴格測試,
Source
]]>
10093
-
基于 NVIDIA DOCA 2.6 實現高性能和安全的 AI 云
http://www.open-lab.net/zh-cn/blog/nvidia-doca-2-6-high-performance-security-ai-cloud/
Thu, 22 Feb 2024 04:20:20 +0000
http://www.open-lab.net/zh-cn/blog/?p=8917
Continued]]>
作為專為 NVIDIA® BlueField® 網絡平臺而設計的數據中心基礎設施軟件框架,NVIDIA® DOCA 使廣大開發者能夠利用其行業標準 API 在 NVIDIA BlueField 網絡平臺上快速創建應用程序和服務,并啟用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的強大功能,提供突破性的網絡、安全和存儲性能。 近日發布的 NVIDIA DOCA 2.6 引入了 NVIDIA BlueField 網絡平臺的新增功能和增強功能,可實現高性能和安全的 AI 云,從而大規模加速數據中心工作負載和 AI 應用。借助可編程擁塞控制(PCC)和數據路徑加速(DPA),更新的 DOCA SDK 也為開發者提供了廣泛的開發框架,并提供新增功能和增強功能。 專為 AI 云而設計的網絡平臺 NVIDIA®…
Source
]]>
8917
-
借助 NVIDIA DOCA 2.5 提供高效、高性能的 AI 云
http://www.open-lab.net/zh-cn/blog/delivering-efficient-high-performance-ai-clouds-with-nvidia-doca-2-5/
Wed, 24 Jan 2024 04:06:54 +0000
http://www.open-lab.net/zh-cn/blog/?p=8798
Continued]]>
作為面向數據中心基礎設施開發者的全面軟件框架, NVIDIA DOCA 已被領先的 AI、云、企業和 ISV 創新者采用。DOCA 2.5 的發布標志著其發布的第三個周年。此外,由于代碼庫的穩定性和可靠性,以及多項網絡和平臺升級,DOCA 2.5 是首個面向 AI 云部署的 NVIDIA BlueField-3 長期支持 (LTS) 版本。 DOCA 2.5 與 NVIDIA 交換機、BlueField DPU 和 SuperNIC 一起,是為支持要求嚴苛的 AI 工作負載而共同設計的平臺的重要元素。作為 NVIDIA 全棧架構的一部分, NVIDIA 的網絡組件可提供出色的應用程序性能以及安全性和數據中心效率。當與 NVIDIA 計算平臺和軟件工具一起部署時,它們可以提供更多的優勢和協同作用。 以下是 NVIDIA 的一些新網絡產品,以及 DOCA 2.5…
Source
]]>
8798
-
使用 AI 增強的網絡安全解決方案增強勒索軟件檢測
http://www.open-lab.net/zh-cn/blog/supercharge-ransomware-detection-with-ai-enhanced-cybersecurity-solutions/
Wed, 06 Sep 2023 05:04:31 +0000
http://www.open-lab.net/zh-cn/blog/?p=7760
Continued]]>
勒索軟件攻擊變得越來越流行,越來越復雜,也越來越難以檢測。例如,在 2022 年,勒索軟件攻擊 的識別耗時 233 天,控制耗時 91 天,總生命周期為 324 天。在這么長的時間內未被發現可能會造成不可逆轉的損害。更快、更智能的檢測能力對于解決這些攻擊至關重要。 NVIDIA DPU 和 GPU 的勒索軟件行為檢測 由于敵人和惡意軟件的發展速度比防御者快,安全團隊往往難以跟蹤變化并維護已知威脅的簽名。為了解決這一問題,我們需要將人工智能與高級安全監控相結合。開發人員可以利用先進的技術,如 NVIDIA BlueField 數據處理器 (DPUs),NVIDIA DOCA SDK 的 DOCA App Shield,以及 NVIDIA Morpheus 網絡安全人工智能框架,更快地構建檢測勒索軟件攻擊的解決方案。
Source
]]>
7760
-
使用 NVIDIA DOCA 2.2 加速數據中心工作負載和 AI 應用程序
http://www.open-lab.net/zh-cn/blog/fast-track-data-center-workloads-and-ai-applications-with-nvidia-doca-2-2/
Tue, 29 Aug 2023 04:50:02 +0000
http://www.open-lab.net/zh-cn/blog/?p=7703
Continued]]>
NVIDIA DOCA SDK 和加速框架為開發人員提供了豐富的庫、驅動程序和 API,以便為 NVIDIA BlueField DPU 和 ConnectX SmartNIC 創建高性能應用程序和服務。它推動了數據中心的創新,實現了應用程序的快速部署。 憑借全面的功能, NVIDIA DOCA 為 BlueField 開發人員提供了一站式服務,他們希望大規模加速數據中心工作負載和人工智能應用程序。 NVIDIA DOCA 已經有超過 10000 名開發者受益,現在已經普遍可用,允許訪問更廣泛的開發者社區,以利用 BlueField DPU 平臺提供創新的人工智能和云服務。 NVIDIA DOCA 2.2 引入了新功能和增強功能,用于卸載、加速和隔離數據中心內的網絡、存儲、安全和管理基礎設施。 NVIDIA BlueField-3 DPU…
Source
]]>
7703
-
利用 NVIDIA DOCA Flow 的 DPU 加速數據包引導邏輯
http://www.open-lab.net/zh-cn/blog/harness-dpu-accelerated-packet-steering-logic-with-nvidia-doca-flow/
Wed, 23 Aug 2023 04:58:55 +0000
http://www.open-lab.net/zh-cn/blog/?p=7669
Continued]]>
NVIDIA DOCA 是一個框架,旨在簡化 NVIDIA BlueField DPUs 和 ConnectX SmartNICs 的編程和應用程序開發。它通過 SDK、運行時二進制文件和高級 API 提供與網絡應用程序相關的高級抽象構建塊,使開發人員能夠快速創建應用程序和服務。 NVIDIA DOCA Flow 是 DOCA 框架中最新更新的一組軟件驅動程序和一個引導庫。它在用戶空間中運行,并能夠從 CPU 卸載與網絡相關的操作。這反過來又使應用程序能夠以低延遲處理高數據包吞吐量的工作負載,從而節省 CPU 資源并降低功耗。 DOCA Flow 還有效地優化了 BlueField DPU 和 ConnectX SmartNIC 的利用率。 DOCA 是釋放 BlueField 加速引擎潛力的關鍵,而 DOCA Flow 允許快速訪問加速引擎以實現數據包導向邏輯。
Source
]]>
7669
-
用 NVIDIA DOCA GPUNetIO 實現實時網絡處理能力
http://www.open-lab.net/zh-cn/blog/realizing-the-power-of-real-time-network-processing-with-nvidia-doca-gpunetio/
Mon, 24 Jul 2023 03:34:05 +0000
http://www.open-lab.net/zh-cn/blog/?p=7509
Continued]]>
網絡流量的實時處理可以通過高并行度 GPU 來利用。在這些類型的應用程序中優化數據包獲取或傳輸可以避免瓶頸,并使整體執行能夠跟上高速網絡的步伐。在這種情況下, DOCA GPU NetIO 將 GPU 提升為一個獨立的組件,可以在沒有 CPU 干預的情況下執行網絡和計算任務。 這篇文章提供了一個 GPU 分組處理應用程序的列表,重點關注不同和不相關的上下文。其中,NVIDIA DOCA GPUNetIO已被集成,以降低延遲并最大限度地提高性能。 NVIDIA DOCA software framework中的 NVIDIA DOCA GPUNetIO 是 DOCA CUDA NetIO 庫,它通過一個或多個 GPU 內核實現 NIC 和 GPU 之間的直接通信,從而從關鍵路徑中移除 CPU。 使用 GPU DOCA NetIO 庫中的 CUDA 設備函數,
Source
]]>
7509
人人超碰97caoporen国产