NVIDIA 通過將硅光技術直接與 NVIDIA Quantum 和 NVIDIA Spectrum 交換機 IC 集成,開辟了新的領域。在 GTC 2025 上,我們推出了全球領先的硅光交換機系統,采用先進的 200G SerDes 技術,與傳統的可插拔光模塊相比,這種創新的硅光一體封裝技術具有顯著的優勢,例如3.5 倍的能耗降低、延遲的降低、以及顯著的網絡可靠性提升等,這些都是加速大規模 AI 模型開發和推理的關鍵因素。
什么是硅光一體化封裝?
硅光一體化封裝技術是硬件集成的一次演進。通過將硅光光收發器直接與交換機 IC 封裝在一起,NVIDIA 實現了:
降低功耗:與傳統的可插拔光模塊相比,硅光一體化封裝可實現3.5 倍的大幅功耗降低。通過消除耗電的外部 DSP 器件和將信號路徑從英寸縮小到毫米,這項突破性技術可顯著提高能效。這種更密集、更可持續的 AI 基礎設施,將推動更快的系統可見性和擴展性,以滿足新一代的 AI 的需求。
減少組件數量:減少部件數量意味著簡化制造流程,減少故障點。將光器件直接集成到封裝中,降低了采購、組裝和測試大量微小部件的復雜性,這是傳統基于光模塊的系統經常面臨的問題。
增強性能:集成光器件后,交換機 ASIC 和光收發器之間的連接將在 IC 封裝層面進行設計、組裝和測試,消除了信號衰減的來源,也消除對獨立的數字信號處理器(DSP) 的需求,DSP往往會引入延遲并消耗額外的電力。
簡化數據中心運營:?簡化施工可加快部署速度并簡化維護。
基于 NVIDIA 硅光技術交換機的主要優勢
以下是 NVIDIA 硅光網絡交換機為現代數據中心帶來的突出優勢。
更低的功耗
傳統模塊使用的 DSP 會顯著增加功耗。例如,一個1.6 Tbps 的光模塊大約需要 30 瓦的供電,其中一半以上會消耗在DSP 上。
通過利用 NVIDIA 集成硅光技術,長期而言,AI 數據中心的能耗比基于傳統光模塊可節省 3.5 倍。
增加網絡正常運行時間和可靠性
傳統光模塊出現故障時,可能需要花費數小時的人工干預來進行故障排除和維修。相比之下,硅光一體化封裝技術采用更簡單的設計,組件更少,可顯著降低光模塊發生故障機率。這種集成設計可更大限度地減少 AI 數據中心宕機時間,提高網絡可靠性,確保網絡保持全面運行,這對于不能間斷的 AI 訓練和推理至關重要。
更低的延遲和更好的信號完整性
NVIDIA 硅光技術將光信號器件直接集成到交換機 IC 封裝中,通過減少元器件數量和大幅縮短信號路徑來提高信號完整性。在傳統基于光模塊的交換機中,信號需要通過印刷電路板或銅線傳輸 14至16 英寸,從而增加了信號被干擾的風險。采用硅光技術,信號路徑才不到 0.5 英寸,大大降低了這種風險。
基于光模塊的交換機還依靠 DSP(數字信號處理器)來清除信號干擾,這會顯著增加延遲。通過將硅光器件直接集成到交換機 IC 中,消除了這種額外的處理過程,從而降低延遲并提高網絡效率,這對于高速 AI 工作負載和現代數據中心性能至關重要。
加快部署速度
與使用可插拔光模塊部署的類似系統相比,采用硅光一體化封裝技術后,系統安裝成為一個簡單的“開箱即安裝”過程,部署速度提高了 1.3 倍。
易于現場維修
該設計將最容易發生故障的組件 (即激光器) 放置于交換機前面板的 OSFP 模塊內,以便于外部激光源 (ELS)插拔,如果發生故障,可以快速診斷和輕松更換。
創新故事:協作與突破
硅光一體化封裝技術的開發歷經多年的努力 (歷時四年) ,其中包括數百項專利的貢獻以及與我們生態系統創新合作伙伴的合作。
自 2016 年合作開始,NVIDIA 不斷突破技術極限,制定了 AI 網絡所需的一些非常嚴格的行業技術規格。
硅光 CPO 制造、封裝和測試
TSMC:?TSMC 的硅光緊湊型通用光子引擎(COUPE)工藝使用 3D 晶圓上芯片堆疊(CoW)及芯片堆疊封裝技術將電子集成電路(EIC)與硅光集成電路(PIC)集成在一起。
SPIL:SPIL 公司以封裝復雜的集成組件而聞名,NVIDIA CPO 多芯片模組的晶圓凸塊、晶圓篩選、組裝和測試就在這里完成。
ELS 激光器及其配件
Lumentum、Sumitomo 和 Coherent:這些硅光引擎供應商提供 ELS 的組裝、光學對準和測試。
光纖、連接器和微光學
Browave, Corning, Senko, TFC Communication 和 Coherent:這些光連接器和光纖組件的行業專家,負責 ELS 激光器與偏振的結合,光纖在硅光引擎中的集成與維護,并將數據輸出到前面板等。
交換機封裝
Foxconn 和 Fabrinet:?這些合作伙伴擅長于系統級 CPO 組裝和測試,以及將交換機CPO 組件及其配件集成到交換機系統機箱內。
總結
NVIDIA 基于硅光技術的網絡交換標志著數據中心網絡的突破性轉變,通過將光收發器直接與交換機 IC 集成,這項創新可實現 3.5 倍的功耗降低、更低的延遲和前所未有的網絡可靠性——所有這些對于支持下一代 AI 應用至關重要。憑借更快速的部署、簡化的設計和更長的正常運行時間,NVIDIA 不僅樹立了新的行業標準,還重新定義了高速、可持續和可擴展的數據中心基礎設施的未來。這是效率與性能交匯的新時代的黎明,加速 AI 突破,并為后代重塑數據中心格局。
詳細了解?NVIDIA 硅光技術。