5G 部署在全球范圍內不斷加快。許多電信運營商已經推出了 5G 服務,并且正在快速擴張。除電信運營商外,企業對使用 5G 建立專用網絡也非常感興趣,這些網絡利用更高的帶寬、更低的延遲、網絡切片、 mmWave 和 CBRS 頻譜。
5G 的崛起恰逢一個有趣的時刻。在過去二十年中,云計算已經成熟,成為開發人員構建應用程序的首選。云提供了許多優勢,包括成熟的軟件工具、自動化和編排、業務靈活性和較低的總體擁有成本( TCO )。
此外,各個領域的應用(工業機器人、云游戲、智能城市、安全、零售、自動駕駛、智能農業)越來越多地使用人工智能( AI )來實現變革性體驗。 5G 、云計算和人工智能的融合將在未來十年推動許多創新。
NVIDIA Aerial SDK 是構建虛擬無線電接入網絡( vRAN )的關鍵技術基礎。它是一個由軟件定義的完整 5G 第 1 層( L1 )卸載,在 NVIDIA GPU 中實現在線加速。它還實現了所有符合 3GPP 和 O-RAN 的接口。由復雜信號處理算法組成的 L1 軟件在 CUDA C / C ++中實現,使優化 L1 算法、實現新功能以及 5G 演進和 6G 的未來驗證 RAN 應用變得容易。 NVIDIA Aerial SDK 作為模塊化微服務實現,采用 E2E 云原生架構,由 Kubernetes 使用標準 ORAN SMO 兼容接口進行管理。
從 CloudRAN 到云中的 RAN
最近有很多關于 CloudRAN 的討論。作為加速計算平臺和云計算領域的行業領導者, NVIDIA 一直處于 CloudRAN 創新的前沿。許多行業領導者正在使用術語 CloudRAN 來表示無線電接入網絡( RAN )的云原生實現。
雖然云原生技術是關鍵,但重要的問題是 CloudRAN 是否等同于使用云原生技術。我們認為事實并非如此。我們認為,真正的云 RAN 具有部署在云中的所有計算元素( vDU 、 vCU 和 dUPF )。因此,術語“云中的 RAN ”是指在多租戶云基礎設施中作為服務完全托管的 5G 無線電接入網絡。
為什么這一區別很重要,云 RAN 的動機是什么?首先, RAN 是電信運營商最大的資本支出和運營支出。它也是最未充分利用的資源,大多數無線電基站的使用率通常低于 50% 。將 RAN 計算遷移到云帶來了云計算的所有好處:共享云基礎設施中的池化和更高的利用率,為電信運營商帶來了最大的資本支出和運營支出減少。
帶有 GPU 加速器的 COTS 平臺不僅可以加速 5G RAN ;它還可以加速邊緣 AI 應用。電信運營商和企業越來越多地使用 NVIDIA GPU 服務器來加速邊緣 AI 應用。除了 AI 應用之外,這提供了使用相同 GPU 資源加速 5G RAN 連接的簡單途徑。這反過來降低了 TCO ,并為建立企業 5G 網絡提供了最佳路徑。
多年來,云軟件、工具和技術已經成熟,除了可靠性、可觀測性和服務保證外,還提供了規模自動化、降低能耗、彈性計算和按需自動縮放的好處。

需要注意的是,一些供應商正在為 RAN L1 卸載設計基于專用集成電路( ASIC )的固定功能加速卡。基于這些基于 ASIC 的加速器構建的 RAN 類似于固定功能設備。它只能執行 RAN L1 處理,并且在不使用時是一個浪費的資源。
具有通用 GPU 加速服務器的 NVIDIA Aerial SDK 提供了一個真正的多服務、多租戶平臺,可用于 5G RAN 、企業 AI 和部署在云中的其他邊緣應用程序,具有上述所有優勢。
云原生作為云 RAN 的基礎
隨著行業加速 5G 部署,實現 5G 的全部商業價值需要可擴展和靈活的解決方案。將 RAN 軟件與硬件分離,并使軟件在云中可用和部署,有可能推動更快的創新和新的增值服務。
云原生 vDU / vCU RAN 軟件套件設計為完全開放和自動化,用于部署和整合操作,支持私有、公共或混合云基礎設施上的 3GPP 和 O-RAN 接口。它利用了云原生架構的優勢,包括水平和垂直擴展、自動修復和冗余。它還針對移動網絡演進進行了優化設計,包括 6G 等下一代無線技術。
NVIDIA Aerial SDK 云原生架構有助于將 RAN 功能實現為 Kubernetes 編排和管理的容器中的微服務。模塊化軟件支持:
- 改進了軟件升級、發布和修補的粒度和速度
- 遵循 DevOps 原則的獨立生命周期管理,具有持續集成和持續交付( CI / CD )
- 不同 RAN 微服務元素的獨立縮放
- 應用級可靠性、可觀測性和服務保證
- 通過網絡自動化簡化操作和維護
要獲得真正的云原生 RAN 體驗,云、邊緣平臺和網絡都需要發展。在我們看來,對于云原生容器化 RAN 軟件棧的商業可部署性而言,許多要求至關重要,包括:
- 時間同步
- CPU 親和性和分離
- 拓撲管理和特征發現
- 多個網絡接口
- 高性能數據平面和加速硬件
- 低延遲、 QoS 保證和高吞吐量
- 遠程分布式部署
- 零接觸配置
- Kubernetes 操作員框架和加速器設備的生產就緒操作員
NVIDIA GPU Operator 使用 Kubernetes 內的操作員框架來自動管理提供 GPU 所需的所有 NVIDIA 軟件組件。這些組件包括設備驅動程序(啟用 CUDA )、 GPU 的 Kubernetes 設備插件、 NVIDIA 容器運行時、自動節點標記、基于數據中心 GPU 管理器( DCGM )的監控等。
GPU 運算符使 Kubernetes 集群的管理員能夠像管理集群中的 CPU 節點一樣管理 GPU nodes 。管理員可以依賴 CPU 和 GPU 節點的標準 OS 映像,然后依賴 GPU Operator 為 GPU 提供所需的軟件組件,而不是為 GPU 節點提供特殊的 OS 映像。
利用 Kubernetes CRD 和運營商 SDK ,它管理與網絡相關的組件,以實現與 RDMA 和 NVIDIA GPUDirect 的快速網絡連接,用于 Kubernete 集群中的工作負載。網絡運營商與 GPU 運營商合作,在兼容系統上啟用 GPU 直接 RDMA 。網絡運營商的目標是管理網絡相關組件,同時在 Kubernetes 集群中執行 RDMA 和 GPU 直接 RDMA 工作負載。
NVIDIA Aerial SDK 基于微服務和云原生架構構建,為在云中構建和部署 5G RAN 提供了堅實的基礎。
在云中構建、部署和管理
O-RAN 聯盟計劃將傳統無線基站分解為 RRU 、 vDU 和 vCU 實例,并在它們之間定義良好的接口,這將產生一個具有供應商選擇的更大生態系統。此外,云原生容器化軟件支持由 Kubernetes 和 SMO 管理的可組合和自動化 RAN 。云化并在云中托管完整的 RAN as a service 需要什么?

部署 5G 的經濟性一直具有挑戰性。與前幾代無線技術相比, 5G 正在推動更高的 RAN 資本支出增長。預計未來 5 年內,細胞站點的數量將增加一倍。因此, RAN 資本支出占總體總體擁有成本的比例從 45-50% 增加到 65% 。有關詳細信息,請參見 Wireless Backhaul Evolution 和 5G-era Mobile Network Cost Evolution 。
此外,眾所周知, RAN 傳統上被提供用于峰值容量,這導致寶貴計算資源的顯著使用不足。突發性和時間依賴性流量意味著許多傳統 RAN 站點的平均容量使用率低于 25% 。如果 RAN 可以托管在云中,則池化的好處可以減少與節能相關的 OpEx 并提高使用率。此外,可以為其他應用程序和工作負載以真正類似云的方式重新配置未使用的資源。
僅在美國,將 420K 個蜂窩基站中的 50% 移動到 GPU 加速云可能會為電信運營商帶來巨大的新收入機會。當 RAN 利用率低且 GPU 未使用時,它們可用于多租戶云環境中的企業 AI 、視頻服務和其他邊緣應用。這可能會在全球帶來新的數十億收入機會。
圖 2 顯示了使用 NVIDIA GPU 的加速計算基礎設施構建的數據中心如何加速許多應用程序,提供云經濟性和最佳總體擁有成本。
NVIDIA AI Enterprise 與 NVIDIA Base Command Platform 和 NVIDIA Fleet Command 軟件使企業能夠在 NVIDIA GPU 云中運行 AI 應用程序,利用各種垂直細分領域的所有預構建和強化軟件。 5G 連接作為一種容器化解決方案,與其他使用相同基礎設施的 AI 應用程序一起運行,對企業來說將是極其強大的。這將改變世界對無線連接的看法。 5G 將成為一種完全基于云的服務,可按需部署。這是云中 RAN 的本質。
使用 NVIDIA 在云端構建 5G RAN
集中 RAN 并將其完全部署在云中有五個關鍵要素,如圖 3 所示。

新的 NVIDIA Spectrum SN3750-SX Open Ethernet Switch 是云解決方案中 RAN 的關鍵組件。它基于 NVIDIA Spectrum-2 以太網 ASIC 構建,是有史以來第一個軟件定義的 xHaul 交換機,能夠提供電信數據中心所需的前端、中間和后端網絡。
該交換機的一個關鍵功能是,它可以被動態編程以將流量路由到數據中心中支持自動縮放和按需 RAN 部署的任何服務器上部署的任何 vDU 。這是第一個將電信和人工智能在同一基礎設施上運行所需的所有功能結合起來的交換機。 SN3750-SX 支持高級定時協議,如電信級精確時間協議( PTP )、同步以太網( SyncE )和 PPS (每秒數據包),以及動態 RU / DU 映射。
為了實現 AI 訓練,交換機支持低延遲 200G 帶寬以實現最高吞吐量。 Spectrum ASIC 帶來了創新功能,如 RoCE (融合以太網上的 RDMA )和自適應路由,所有這些功能都具有最高的網絡規模。應該注意的是,許多應用程序(如元宇宙和 AR / VR )需要支持 PTP 的數據中心。這將為云用例中的 RAN 鋪平道路。一些網絡規模的公司已經在其數據中心支持 PTP 。
具有 NVIDIA A100 Tensor Core GPU 和 NVIDIA BlueField DPU 的 NVIDIA A100X converged accelerator 支持完全內聯 5G RAN 卸載。這為從 4T4R 到大規模 MIMO 32T32R 和 64T64R 的一系列配置提供了以每瓦單元密度和每瓦 MHz 層數衡量的市場領先性能。
NVIDIA 正在與各種生態系統合作伙伴合作,以確保其他 O-RAN 軟件組件(如 SMO (服務管理和編排)、 RIC ( RAN 智能控制器)、 xApps 和 rApps )針對 NVIDIA Aerial SDK 進行優化,并為云部署中的 RAN 做好準備。這些組件仍處于早期開發階段,但將是關鍵的區別,因為它們使用人工智能實現 RAN 自動化和可編程性。雖然云計算中的 RAN 需要一段時間才能成熟,但我們相信 NVIDIA 將在這一創新的前沿,以 NVIDIA GPU 加速平臺為基礎。
總結
云計算中的 RAN 是未來。這是無線市場的自然演變和下一步。使用云原生技術構建的 vRAN 是必要的第一步。要實現 5G RAN 的云經濟,并推動 5G 與邊緣 AI 應用的共同創新,需要在云中擁抱 RAN 。 NVIDIA Aerial SDK 提供了可擴展的云原生軟件架構,作為云中 RAN 的基礎技術。
最后,需要注意的是 RAN 轉換剛剛開始。使用人工智能優化復雜的信號處理算法將在未來幾年帶來一系列全新的創新。 GPU 加速平臺是您的投資經得起未來考驗的最佳方法。如果您想與我們合作,在云解決方案中構建創新的 RAN ,請聯系我們。有關詳細信息,請參見 NVIDIA AI-on-5G Platform 。
免費注冊GTC 2023 , 3 月 20 日至 23 日加入我們的 人工智能驅動的無線會話?和 AI 驅動的邊緣對話 。 瀏覽所有通信對話了解更多。
?