Spectrum – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 19 Oct 2023 06:21:53 +0000 zh-CN hourly 1 196178272 適用于數據中心和 AI 時代的網絡 http://www.open-lab.net/zh-cn/blog/networking-for-data-centers-and-the-era-of-ai/ Thu, 12 Oct 2023 06:19:21 +0000 http://www.open-lab.net/zh-cn/blog/?p=8021 Continued]]> 十多年來,傳統的云數據中心一直是計算基礎設施的基石,滿足了各種用戶和應用程序的需求。然而,近年來,為了跟上技術的進步和對 AI 驅動的計算需求的激增,數據中心進行了發展。本文探討了網絡在塑造數據中心的未來和推動 AI 時代方面發揮的關鍵作用。 目前正在涌現兩類不同的數據中心:AI 工廠和 AI 云。這兩類數據中心都是為滿足 AI 工作負載的獨特需求而定制的,其特點是依賴于加速計算。 AI 工廠旨在處理大規模的工作流程,并開發大語言模型 (LLM) 和其他基礎 AI 模型。這些模型是構建更先進 AI 系統的基礎模組。為了實現跨數千個 GPU 的無縫擴展和資源高效利用,強大的高性能網絡勢在必行。 AI 云擴展了傳統云基礎設施的功能,以支持大規模生成式人工智能應用程序。生成式 AI 超越了傳統的 AI 系統,它基于其訓練的數據創建新的內容,例如圖像、文本和音頻。

Source

]]>
8021
使用 NVIDIA Spectrum 以太網最大限度地提高存儲網絡性能 http://www.open-lab.net/zh-cn/blog/maximizing-network-performance-for-storage-with-nvidia-spectrum-ethernet/ Mon, 26 Jun 2023 06:25:30 +0000 http://www.open-lab.net/zh-cn/blog/?p=7272 Continued]]> 隨著數據生成的不斷增加,線性性能擴展已成為擴展存儲的絕對要求。存儲網絡就像汽車道路系統:如果道路不是為速度而建的,那么汽車的潛在速度也無關緊要。即使是法拉利在充滿障礙的未鋪路面的土路上也很慢。 擴展存儲性能可能會受到連接存儲節點的以太網結構的阻礙。 NVIDIA 加速以太網可以消除性能瓶頸,為一般應用程序,特別是 AI / ML 實現最大的存儲性能。 全球每秒有 54000 張照片被拍攝。當你讀到這篇文章的時候,這個數字會更高。無論您的業務是什么,您都有可能擁有大量必須存儲和分析的數據,而且數據量每天都在增長。 使用越來越大的存儲文件管理器的舊的按比例擴展方法已被一種按比例擴展的方法所取代,這種方法可以提供容量和性能都呈線性擴展的存儲。 使用擴展存儲或分布式存儲,可以將幾個較小的節點配置和連接為一個邏輯單元。單個文件或對象可以分布在多個節點上。

Source

]]>
7272
使用 NVIDIA Spectrum-X 網絡平臺進行渦輪增壓生成 AI 工作負載 http://www.open-lab.net/zh-cn/blog/turbocharging-ai-workloads-with-nvidia-spectrum-x-networking-platform/ Mon, 29 May 2023 05:44:44 +0000 http://www.open-lab.net/zh-cn/blog/?p=7104 Continued]]> 大型語言模型( LLM )和人工智能應用程序,如ChatGPT和 DALL-E 最近出現了快速增長。由于 GPU 、 CPU 、 DPU 、高速存儲和人工智能優化的軟件創新,人工智能現在可以廣泛使用。你甚至可以在云端或內部部署人工智能。 然而,人工智能應用程序可能會對網絡造成很大負擔,這種增長給 CPU 和 GPU 服務器以及連接這些系統的現有底層網絡基礎設施帶來了負擔。 傳統的以太網雖然足以處理主流和企業應用程序,如網絡、視頻或音頻流,但沒有經過優化以支持新一代人工智能工作負載。傳統以太網是松耦合應用、低帶寬流和高抖動的理想選擇。它可能足以滿足異構流量(如網絡、視頻或音頻流、文件傳輸和游戲),但在出現超額訂閱時并不理想 NVIDIA Spectrum-X 網絡平臺從頭開始設計,以滿足人工智能應用程序的性能需求,是一種針對高速網絡性能、

Source

]]>
7104
使用 NVIDIA WJH 更快地診斷網絡問題 http://www.open-lab.net/zh-cn/blog/diagnosing-network-issues-faster-with-wjh/ Thu, 04 May 2023 03:49:59 +0000 http://www.open-lab.net/zh-cn/blog/?p=6936 Continued]]> 人工智能已經無縫地融入了我們的生活,并以幾年前我們甚至無法想象的方式改變了我們。在過去,對人工智能的感知是一種未來主義和復雜的東西。只有大公司在其擁有 HPC 技術的超級計算機上使用人工智能來預測天氣,并在醫療保健和科學領域取得突破性發現。 如今,由于 GPU 、 CPU 、高速存儲和人工智能優化的軟件創新,每個人都可以訪問人工智能。您甚至可以將人工智能作為服務( SaaS )或基礎設施( IaaS )部署在云中。 我們見證了人工智能在每個行業的廣泛應用:醫療保健和金融、自動駕駛汽車、廣告推薦,以及最近創建和編輯視頻、圖像和音樂等內容的生成人工智能。隨著最近推出的 ChatGPT-4 ,它使用大型語言模型( LLM )來理解、響應,甚至像人類一樣生成文本,思考我們可以實現的無限潛力是令人興奮的。 充分利用您的人工智能需要的不僅僅是昂貴的高端 GPU 和存儲系統。

Source

]]>
6936
為 Microsoft Azure SONiC 選擇 NVIDIA Spectrum http://www.open-lab.net/zh-cn/blog/choosing-spectrum-for-microsoft-azure-sonic/ Mon, 31 Oct 2022 06:05:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5588 Continued]]> 每個人都認為開放式解決方案是最好的解決方案,但真正開放的以太網交換機操作系統很少。在 NVIDIA ,我們擁抱了以太網交換機的開源。除了支持 SONiC ,我們還為開源社區項目貢獻了許多創新。 這篇文章最初于 2018 年 6 月發布在 Mellanox 博客上,但已更新。 微軟使用 Azure 運行著世界上最大的云之一。在構建和部署 Azure 的過程中,他們對管理全球、高性能、高可用性和安全的網絡有了很多見解。 微軟用于 Azure 的網絡操作系統( NOS ) SONiC (云開放網絡軟件)是基于開源的。他們在數百個數據中心和數萬臺交換機上的經驗讓他們了解了需要什么: SONiC 是網絡交換機操作和管理的突破,它滿足了這些要求。微軟將這項創新開源給社區,并在他們的 SONiC GitHub 存儲庫中提供。 SONiC 是一個獨特的可擴展平臺,

Source

]]>
5588
在 NVIDIA Spectrum 交換機上使用精確定時協議計算和同步時間 http://www.open-lab.net/zh-cn/blog/calculating-and-synchronizing-time-with-the-precision-timing-protocol-on-the-nvidia-spectrum-switch/ Fri, 09 Sep 2022 05:39:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5285 Continued]]> PTP 使用一種算法和方法在基于數據包的網絡上同步各種設備上的時鐘,以提供亞微秒精度。 NVIDIA Spectrum 支持一步和兩步模式的 PTP ,可以用作邊界或透明時鐘。 以下是交換機作為透明時鐘時,如何在一步模式下計算和同步時間。在這篇文章的后面,我回顧了 PTP 的整體準確性。 在一步模式下,當用作透明時鐘時,交換機必須實時計算 PTP 數據包的駐留時間。它通過比較數據包到達的時間( t1 )和數據包離開的時間( t2 )來實現這一點。然后,交換機相應地更改數據包的校正字段。 要執行此計算,交換機使用多個硬件功能: 由于入口處的 t1 和出口處的 t2 位于兩個不同的交換機端口上, ASIC 不同部分之間的時間同步必須具有高分辨率,以保持準確的比較。 在有時工作于不同頻率的不同硬件單元之間同步時間戳是一項挑戰。頻譜系列 ASIC 可以保持小于 4…

Source

]]>
5285
人人超碰97caoporen国产