• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 生成式人工智能/大語言模型

    借助 2D 和 3D 數字人虛擬形象擴展 AI 智能體界面選項

    在與 生成式 AI 應用程序交互時,用戶有多種通信選項 – 文本、語音或通過數字化的虛擬形象。

    傳統聊天機器人或 Copilot 應用具有文本界面,用戶可在其中輸入查詢并接收基于文本的響應。對于免持通信,語音人工智能技術如 自動語音識別 (ASR) 和 文本轉語音 (TTS) 促進了口頭互動,非常適合電話客戶服務等場景。此外,將數字化虛擬形象與語音能力相結合,可為用戶提供更具動態性的界面,以便用戶以直觀方式與應用互動。根據 Gartner 的預測,到 2028 年,擁有 500 名以上員工的組織中,45% 的組織將利用員工人工智能虛擬形象來擴展人力資本能力。1

    數字虛擬形象的風格差異很大,一些用例受益于逼真的 3D 或 2D 虛擬形象,而其他用例使用風格化或卡通化的虛擬形象時效果更好。

    • 3D 虛擬形象 提供完全身臨其境的體驗,展示逼真的動作和逼真效果。開發這些虛擬形象需要專業的軟件和技術專業知識,因為它們涉及復雜的身體動畫和高質量渲染。
    • 2D 虛擬形象 的開發速度更快,是 Web 嵌入式解決方案的理想選擇。它們提供了一種創建交互式 AI 的簡化方法,通常需要藝術家進行設計和動畫,但在技術資源方面的投入較少。

    要開始創建逼真的數字人,您可以針對各種用例定制適用于客戶服務的數字人的 NVIDIA AI 藍圖 。此功能現已包含在對 NVIDIA Maxine Audio2Face-2D NIM 微服務的支持中。此外,藍圖現在還為 3D 虛擬形象開發者提供了使用 Unreal Engine 的渲染靈活性。

    如何向代理應用程序添加會說話的數字化虛擬形象

    在數字人的 AI 藍圖中,用戶與利用 NVIDIA ACE 技術的 AI 智能體 進行交互(圖 1)。

    Diagram illustrating the architecture of the digital human AI Blueprint where a user interacts with an NVIDIA ACE agent that is connected to a RAG pipeline to generate a response.
    圖 1. NVIDIA AI 藍圖(數字人)架構圖

    用戶的音頻輸入將發送到 ACE 代理,ACE 代理負責編排各種 NIM 微服務之間的通信。ACE 代理使用 Riva Parakeet NIM 將音頻轉換為文本,然后由 RAG 流水線進行處理。RAG 流水線使用 NVIDIA NeMo Retriever 嵌入 重新排序 NIM 微服務,以及 LLM NIM ,來響應存儲文檔中的相關上下文。

    最后,通過 Riva TTS 將響應轉換回語音,使用 Audio2Face-3D NIM 或 Audio2Face-2D NIM 為數字人制作動畫。

    設計 AI 智能體應用時的注意事項

    在全球企業中,跨語言的通信障礙會降低運營速度。具有多語種功能的 AI 虛擬形象可以輕松進行跨語言通信。數字人 AI 藍圖提供對話式 AI 功能,可通過 Riva ASR、神經機器翻譯(NMT)以及智能中斷和交換支持,模擬人類互動,適應用戶的語音風格和語言。

    數字人 AI 智能體的主要優勢之一是能夠為員工和客戶提供“始終在線”的資源。由 RAG 提供支持的 AI 智能體不斷從交互中學習并隨著時間的推移而改進,從而提供更準確的響應和更好的用戶體驗。

    對于考慮使用數字人機界面的企業來說,選擇合適的虛擬形象和渲染選項取決于用例和定制偏好。

    • 用例 :3D 虛擬形象非常適合高度沉浸式的用例,例如實體店、售貨亭或主要是一對一的交互,而 2D 虛擬形象則適用于 Web 或移動對話式 AI 的用例。
    • 開發和自定義偏好 :擁有 3D 和動畫專業知識的團隊可以利用其技能組合創建沉浸式和超逼真的虛擬形象,而希望快速迭代和自定義的團隊可以從簡單的 2D 虛擬形象中受益。
    • 擴展注意事項:在評估角色和相應的渲染選項時,擴展是一個重要考慮因素。流吞吐量,尤其是 3D 角色的流吞吐量,在很大程度上取決于所使用的角色資產的選擇和質量,所需的輸出分辨率和所選的渲染選項(Omniverse Renderer 或 Unreal Engine)在確定每個流計算足跡方面發揮著關鍵作用。

    NVIDIA Audio2Face-2D 支持僅通過肖像和語音輸入創建栩栩如生的 2D 虛擬形象。簡單易用的配置可讓開發者快速迭代,并為其數字人用例生成目標虛擬形象和動畫。憑借實時輸出和云原生部署,2D 數字人是交互式用例的理想選擇,也是交互式 Web 嵌入式解決方案流式傳輸虛擬形象的理想選擇。

    例如,希望在多臺設備上部署 AI 代理并將數字人插入 Web 或移動優先客戶旅程的企業,可以從 2D 虛擬形象的硬件需求降低中受益。

    逼真的 3D 虛擬形象可為要求高度同理心的用戶參與度的用例提供無與倫比的沉浸式體驗。NVIDIA Audio2Face-3D 和 Animation NIM 微服務通過生成混合形狀以及微妙的頭部和身體動畫,為 3D 角色制作動畫,以創建逼真的沉浸式虛擬形象。數字人 AI 藍圖現在支持兩個 3D 虛擬形象渲染選項,包括 NVIDIA Omniverse Renderer 和 Unreal Engine Renderer,讓開發者能夠靈活地集成他們選擇的渲染選項。

    要探索數字人如何增強您的企業,請訪問 NVIDIA API 目錄,了解不同的人像選項。

    數字虛擬形象入門?

    要使用 Audio2Face-2D 和 Unreal Engine NIM 微服務進行實踐開發,請 申請 ACE Early Access 或深入閱讀 數字人 AI 藍圖技術博客 ,了解如何將數字人界面添加到個性化的聊天機器人應用中。

    1Gartner?,《未來工作的炒作周期》(Hype Cycle for the Future of Work),2024 年,作者:Tori Paulman、Emily Rose McRae 等,2024 年 7 月。GARTNER 是 Gartner, Inc.和/或其關聯公司在美國和國際上的注冊商標和服務商標,經許可在此使用。所有權利保留。

    ?

    +1

    標簽

    人人超碰97caoporen国产