以太網 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 12 Dec 2024 04:06:47 +0000
zh-CN
hourly
1
196178272 -
在 SONiC 中通過安全啟動保護您的網絡
http://www.open-lab.net/zh-cn/blog/protect-your-network-with-secure-boot-in-sonic/
Tue, 29 Oct 2024 05:18:29 +0000
http://www.open-lab.net/zh-cn/blog/?p=11772
Continued]]>
NVIDIA 技術可幫助組織構建和維護安全、可擴展和高性能的網絡基礎設施。以 NVIDIA 為前沿的人工智能技術的進步每天都在推動安全方面的進步。NVIDIA 采取更直接的方法之一是通過安全的網絡操作系統(NOS)。 安全網絡操作系統(NOS)是一種專門類型的 NOS,專注于強大的安全功能,以保護網絡基礎設施免受各種威脅。 不同的系統 提供各種安全功能。有些系統提供內置防火墻、VPN 或監控工具。有些系統提供高級威脅檢測和響應功能。有些系統在啟動級別提供強化的安全性,甚至在操作系統加載之前就能防止攻擊。其中一項功能稱為 Secure Boot。 越來越多的 NVIDIA 平臺支持安全標準 Secure Boot。Secure Boot 是一項安全 UEFI(統一可擴展固件接口)功能,旨在防止在啟動過程和固件更新期間運行未經授權的固件或軟件。
Source
]]>
11772
-
NVIDIA SuperNIC 驅動新一代 AI 網絡發展
http://www.open-lab.net/zh-cn/blog/powering-next-generation-ai-networking-with-nvidia-supernics/
Tue, 15 Oct 2024 04:39:33 +0000
http://www.open-lab.net/zh-cn/blog/?p=11675
Continued]]>
在生成式 AI 時代,加速網絡對于為大規模分布式 AI 工作負載構建高性能計算結構至關重要。NVIDIA 在該領域繼續保持領先地位,提供先進的以太網和 InfiniBand 解決方案,可最大限度地提高 AI 工廠和云數據中心的性能和效率。 這些解決方案的核心是 NVIDIA SuperNIC,一種經過優化的新型網絡加速器,可為超大規模 AI 工作負載提供支持。這些 SuperNIC 是 NVIDIA Spectrum-X 以太網和 Quantum-X800 InfiniBand 網絡平臺的關鍵組件,旨在提供前所未有的可擴展性和性能。 NVIDIA SuperNIC 產品組合中的最新成員 ConnectX-8 SuperNIC 與 BlueField-3 SuperNIC 一起,共同推動加速的大規模 AI 計算結構的新一輪創新浪潮。
Source
]]>
11675
-
NVIDIA Spectrum-X 加速大規模 AI 工作負載優化
http://www.open-lab.net/zh-cn/blog/optimize-large-scale-ai-workloads-with-nvidia-spectrum-x/
Tue, 27 Aug 2024 07:34:09 +0000
http://www.open-lab.net/zh-cn/blog/?p=11104
Continued]]>
在當今迅速發展的技術格局中,保持領先地位不僅僅是一個目標——這是一個必要條件。創新浪潮,尤其是 AI 領域的創新,正在推動整個技術堆棧的巨大變革。 見證深刻變革的一個領域是以太網(Ethernet)網絡,這是數字通信的基石,數十年來一直是企業和數據中心環境的基礎。 如今,每個數據中心都在加速,以支持現代 AI 工作負載,從而增加了對支持這些工作負載的基礎設施的需求。許多企業已經非常熟悉 Ethernet,將其作為可信網絡標準。然而,他們缺乏一種解決方案來充分支持使用 Ethernet 協議的 AI 工作負載的特性。 NVIDIA 的創新愿望通常是出于對理解和響應客戶不斷變化的需求的深刻承諾,確保我們的解決方案不僅滿足而且可以預測并超過預期。 進入 NVIDIA Spectrum-X 時代,NVIDIA Spectrum-X 是全球首款高性能以太網結構,
Source
]]>
11104
-
在 NVIDIA Air 上探索 SONiC
http://www.open-lab.net/zh-cn/blog/exploring-sonic-on-nvidia-air/
Mon, 24 Jun 2024 05:45:21 +0000
http://www.open-lab.net/zh-cn/blog/?p=10438
Continued]]>
測試網絡基礎設施和為新環境構建可工作的 PoC,往好了說可能很棘手,往壞了說可能非常可怕。你可能會遇到無法滿足的許可要求,或者為高級虛擬機軟件支付昂貴的費用。專有網絡系統可能花費數百或數千美元,只是為了建立一個可供使用的測試環境。你甚至可能會被迫在物理、可能過時的硬件上進行測試,你必須自己連接,如果你需要用更多的硬件進行測試,你必須找到并購買更多。 進入SONiC(云中開放網絡軟件),這是一個免費的、社區開發的、基于 Linux 的網絡操作系統(NOS),它在一些最大的云服務提供商的數據中心得到了加強 SONiC 是尋求低成本、可擴展和完全可控的 NOS 而又不犧牲靈活性或安全性的中心的理想選擇,它提供了開發人員所需的所有標準網絡功能,并隨著新功能和更新不斷發展。 Community SONiC 是開源的,與專有的 NOS 相比,它消除了許可和供應商鎖定墻,并顯著降低了成本,
Source
]]>
10438
-
借助加速網絡實現數據中心現代化
http://www.open-lab.net/zh-cn/blog/modernizing-the-data-center-with-accelerated-networking/
Tue, 30 Jan 2024 04:05:10 +0000
http://www.open-lab.net/zh-cn/blog/?p=8861
Continued]]>
加速網絡將 CPU、GPU、DPU(數據處理單元)或 SuperNIC 組合成加速計算結構,專門設計用于優化網絡工作負載。它使用專用硬件來卸載要求嚴苛的任務,以增強服務器功能。隨著 AI 和其他新工作負載的復雜性和規模不斷增加,對加速網絡的需求變得至關重要。 數據中心作為計算的新單元,隨著網絡服務對CPU壓力的增加,現代工作負載對網絡基礎設施提出了新的挑戰。網絡基礎設施需要具備敏捷性、自動化和可編程性,并配備加速器和卸載功能,這些是充分發揮人工智能技術潛力和推動創新的關鍵。 本文將探討加速網絡技術在數據中心中的優勢和實施策略,并重點介紹其在提升性能、可擴展性和效率方面的作用。 網絡加速需要優化網絡的各個方面,包括處理器、網絡接口卡 (NIC)、交換機、線纜、光學和網絡加速軟件。利用無損網絡、遠程直接內存訪問 (RDMA)、動態路由、擁塞控制、性能隔離和網絡計算,
Source
]]>
8861
-
適用于數據中心和 AI 時代的網絡
http://www.open-lab.net/zh-cn/blog/networking-for-data-centers-and-the-era-of-ai/
Thu, 12 Oct 2023 06:19:21 +0000
http://www.open-lab.net/zh-cn/blog/?p=8021
Continued]]>
十多年來,傳統的云數據中心一直是計算基礎設施的基石,滿足了各種用戶和應用程序的需求。然而,近年來,為了跟上技術的進步和對 AI 驅動的計算需求的激增,數據中心進行了發展。本文探討了網絡在塑造數據中心的未來和推動 AI 時代方面發揮的關鍵作用。 目前正在涌現兩類不同的數據中心:AI 工廠和 AI 云。這兩類數據中心都是為滿足 AI 工作負載的獨特需求而定制的,其特點是依賴于加速計算。 AI 工廠旨在處理大規模的工作流程,并開發大語言模型 (LLM) 和其他基礎 AI 模型。這些模型是構建更先進 AI 系統的基礎模組。為了實現跨數千個 GPU 的無縫擴展和資源高效利用,強大的高性能網絡勢在必行。 AI 云擴展了傳統云基礎設施的功能,以支持大規模生成式人工智能應用程序。生成式 AI 超越了傳統的 AI 系統,它基于其訓練的數據創建新的內容,例如圖像、文本和音頻。
Source
]]>
8021
-
用于提升數據中心冗余的解決方案比較
http://www.open-lab.net/zh-cn/blog/comparing-solutions-for-boosting-data-center-redundancy/
Fri, 29 Sep 2023 04:48:43 +0000
http://www.open-lab.net/zh-cn/blog/?p=7965
Continued]]>
在當今的數據中心,通過連接到網絡的服務器實現系統冗余的方法有很多。客戶通常會尋求冗余來提高服務可用性(例如實現端到端 AI 工作負載),并使用不同的多歸技術來提高系統效率。 在本文中,我們將討論知名的專有多機箱鏈路聚合組 (MLAG) 與基于標準的 EVPN 多歸站 (EVPN-MH) 相比的優缺點。 對于所有現代數據中心而言,多歸位都是必要的,這使得單個主機能夠連接到兩個或多個節點,并以全主動或單主動的方式提供服務。全主動側重于首先增加容量,其次是冗余。單主動主要側重于冗余。 在互聯網服務提供商領域,多域名 (Multihoming) 是一個常見的概念,主要用于接入點位置,即客戶設備與提供商邊緣設備位置互連。 此連接幾乎始終是第 3 層路由連接,不會帶來第 2 層世界的挑戰,因為它旨在解決冗余站點訪問或互聯網訪問。但是,在數據中心,
Source
]]>
7965
-
使用 NVIDIA Spectrum 以太網最大限度地提高存儲網絡性能
http://www.open-lab.net/zh-cn/blog/maximizing-network-performance-for-storage-with-nvidia-spectrum-ethernet/
Mon, 26 Jun 2023 06:25:30 +0000
http://www.open-lab.net/zh-cn/blog/?p=7272
Continued]]>
隨著數據生成的不斷增加,線性性能擴展已成為擴展存儲的絕對要求。存儲網絡就像汽車道路系統:如果道路不是為速度而建的,那么汽車的潛在速度也無關緊要。即使是法拉利在充滿障礙的未鋪路面的土路上也很慢。 擴展存儲性能可能會受到連接存儲節點的以太網結構的阻礙。 NVIDIA 加速以太網可以消除性能瓶頸,為一般應用程序,特別是 AI / ML 實現最大的存儲性能。 全球每秒有 54000 張照片被拍攝。當你讀到這篇文章的時候,這個數字會更高。無論您的業務是什么,您都有可能擁有大量必須存儲和分析的數據,而且數據量每天都在增長。 使用越來越大的存儲文件管理器的舊的按比例擴展方法已被一種按比例擴展的方法所取代,這種方法可以提供容量和性能都呈線性擴展的存儲。 使用擴展存儲或分布式存儲,可以將幾個較小的節點配置和連接為一個邏輯單元。單個文件或對象可以分布在多個節點上。
Source
]]>
7272
-
利用 MLAG 最大限度地提高 AI 以太網結構性能
http://www.open-lab.net/zh-cn/blog/maximizing-hpc-cluster-ethernet-fabric-performance-with-mlag/
Wed, 21 Jun 2023 07:17:18 +0000
http://www.open-lab.net/zh-cn/blog/?p=7287
Continued]]>
對于專門為人工智能訓練而構建的 HPC 集群,例如 NVIDIA DGX BasePOD 和 NVIDIA DGX SuperPOD,微調集群對于提高和優化整體性能至關重要,包括調整以太網結構、存儲結構和計算結構的性能。 本文討論了如何最大限度地提高以太網結構的整體吞吐量,通過使用Multi-Chassis Link Aggregation(MLAG),可在NVIDIA Cumulus Linux上實現。MLAG 使兩個獨立的交換機能夠向下游主機通告相同的 LACP 系統 ID,因此,下游主機會認為它們連接到單個 LACP 伙伴。 使用 MLAG 的一個好處是物理交換機級冗余。如果兩個上行鏈路交換機中的任何一個發生故障,則下游主機流量將不會受到影響。第二個好處是聚合債券的上行鏈可以同時使用。最后, MLAG 技術使用諸如 VRR / VRRP 之類的技術提供網關級冗余。
Source
]]>
7287
-
5G 網絡安全的新前沿
http://www.open-lab.net/zh-cn/blog/a-new-frontier-for-5g-network-security/
Wed, 31 May 2023 05:10:30 +0000
http://www.open-lab.net/zh-cn/blog/?p=7081
Continued]]>
無線技術發展迅速, 5G 部署在世界各地取得了良好進展。直到最近,無線 RAN 還使用傳統 RAN 供應商的封閉式設備解決方案進行部署。這種封閉式方法不可擴展,未充分利用基礎設施,并且不能提供最佳的 RAN TCO 。它有許多缺點。 我們已經意識到,這種封閉式解決方案在 5G 時代是不可擴展和有效的。 因此,電信行業聯合起來,在具有開放和標準接口的商用現貨( COTS )硬件平臺上推廣和構建虛擬化和云原生 RAN 解決方案。這使得在通用服務器平臺上能夠實現更大的生態系統和靈活的解決方案,利用虛擬化和云原生技術的優點。 這種方法有很多積極的方面:更低的成本、更大的生態系統和供應商選擇、更快的創新周期、自動化和可擴展性。然而,一個令人擔憂的領域是,開放式 RAN 架構可能導致更大的攻擊面,并可能導致新的安全風險。 作為加速計算平臺的技術領導者,
Source
]]>
7081
-
使用 NVIDIA Spectrum-X 網絡平臺進行渦輪增壓生成 AI 工作負載
http://www.open-lab.net/zh-cn/blog/turbocharging-ai-workloads-with-nvidia-spectrum-x-networking-platform/
Mon, 29 May 2023 05:44:44 +0000
http://www.open-lab.net/zh-cn/blog/?p=7104
Continued]]>
大型語言模型( LLM )和人工智能應用程序,如ChatGPT和 DALL-E 最近出現了快速增長。由于 GPU 、 CPU 、 DPU 、高速存儲和人工智能優化的軟件創新,人工智能現在可以廣泛使用。你甚至可以在云端或內部部署人工智能。 然而,人工智能應用程序可能會對網絡造成很大負擔,這種增長給 CPU 和 GPU 服務器以及連接這些系統的現有底層網絡基礎設施帶來了負擔。 傳統的以太網雖然足以處理主流和企業應用程序,如網絡、視頻或音頻流,但沒有經過優化以支持新一代人工智能工作負載。傳統以太網是松耦合應用、低帶寬流和高抖動的理想選擇。它可能足以滿足異構流量(如網絡、視頻或音頻流、文件傳輸和游戲),但在出現超額訂閱時并不理想 NVIDIA Spectrum-X 網絡平臺從頭開始設計,以滿足人工智能應用程序的性能需求,是一種針對高速網絡性能、
Source
]]>
7104
-
為網絡管理員導航生成式人工智能
http://www.open-lab.net/zh-cn/blog/navigating-generative-ai-for-network-admins/
Thu, 25 May 2023 06:33:54 +0000
http://www.open-lab.net/zh-cn/blog/?p=7130
Continued]]>
我們都知道人工智能正在改變世界。對于網絡管理員來說,人工智能可以以一些驚人的方式改善日常運營: 然而,人工智能無法取代經驗豐富的網絡管理員的專業知識。人工智能旨在增強你的能力,就像一個虛擬助理。因此,人工智能可能會成為你最好的朋友,但生成型人工智能也是一種新的數據中心工作負載,它帶來了新的范式轉變: NVIDIA 集體通信庫( NCCL )。 網絡管理員不得不處理許多其他最近的更改: 不久前,我們可能已經通過特定網絡命令行界面( CLI )的專業水平來衡量新網絡管理員的價值。隨著混合云計算和 DevOps 的出現,從 CLI 到 API 的轉變越來越大。 Ansible 、 SALT 和 Python 方面的技能現在比 Cisco 認證更有價值。 甚至您監控和管理網絡的方式也發生了變化。您已經從使用 SNMP 和 NetFlow…
Source
]]>
7130
-
使用 NVIDIA WJH 更快地診斷網絡問題
http://www.open-lab.net/zh-cn/blog/diagnosing-network-issues-faster-with-wjh/
Thu, 04 May 2023 03:49:59 +0000
http://www.open-lab.net/zh-cn/blog/?p=6936
Continued]]>
人工智能已經無縫地融入了我們的生活,并以幾年前我們甚至無法想象的方式改變了我們。在過去,對人工智能的感知是一種未來主義和復雜的東西。只有大公司在其擁有 HPC 技術的超級計算機上使用人工智能來預測天氣,并在醫療保健和科學領域取得突破性發現。 如今,由于 GPU 、 CPU 、高速存儲和人工智能優化的軟件創新,每個人都可以訪問人工智能。您甚至可以將人工智能作為服務( SaaS )或基礎設施( IaaS )部署在云中。 我們見證了人工智能在每個行業的廣泛應用:醫療保健和金融、自動駕駛汽車、廣告推薦,以及最近創建和編輯視頻、圖像和音樂等內容的生成人工智能。隨著最近推出的 ChatGPT-4 ,它使用大型語言模型( LLM )來理解、響應,甚至像人類一樣生成文本,思考我們可以實現的無限潛力是令人興奮的。 充分利用您的人工智能需要的不僅僅是昂貴的高端 GPU 和存儲系統。
Source
]]>
6936
人人超碰97caoporen国产