如今,品牌及其創意機構承受著巨大的壓力,需要大規模地創建和提供高質量、準確的產品圖片,從活動關鍵視覺效果到電子商務包裝截圖等。面向受眾的內容,如個性化和本地化視覺變化,增加了制作的復雜性。
制作成本、短時間線、資源和維護品牌身份都是營銷團隊創建更多資產和更具針對性的內容的重復障礙。
例如,意式特濃咖啡制造商可能希望在即將推出的產品中面向廣泛的受眾,從居住在城市的年輕專業人士到在鄉村享受退休生活的老一代。歷史上,這需要多個工作流程、地點、團隊和審查周期來執行,而這通常是不可能的,這會限制營銷團隊用于定位的可用內容。
為了大規模地為廣泛的受眾群體生成高質量、品牌準確的內容,創意團隊現在可以利用生成式 AI 工作流。將生成式 AI 集成到用于生成準確的視覺資產和制作內容的工具和應用中,可以為內容供應鏈帶來新的可能性和效率。
許多開發者已經在努力將其變為現實。
在本文中,我們將介紹用于精確視覺生成式 AI 的 3D 條件 的 NVIDIA Omniverse 藍圖,概述其工作原理及其用途,并聆聽一些行業領導者講述他們如何考慮該領域的發展。
NVIDIA Omniverse 藍圖是參考工作流,可讓您輕松實施和構建 3D、模擬和 數字孿生 應用。

模型調節以解鎖生成式 AI,從而實現可擴展和可控的資產創建
如果無法控制產品的視覺輸入,將生成式 AI 集成到工作流程中以創建精確的品牌形象可能會有問題。您可能會讓特定的幾何圖形、顏色、徽標和品牌指南被誤解或丟失,而不需要特定的條件。
模型條件 是指為模型提供特定信息或規則,幫助其根據您的期望做出更好的預測或決策。要調節 LLM,您需要提供基于文本的說明、示例、上下文或之前的對話歷史記錄。對于圖像生成器,您可以提供文本或示例圖像。
但這只能提供對 AI 模型如此多的控制。這就是為什么需要 3D 條件。
通過在 3D 環境中設置舞臺,藝術家能夠對生成的視覺效果的輸出進行出色的創意控制或指導。為最終用戶交互構建易于使用的 UI,使非技術團隊能夠在受控和有條件的框架中迭代和創建內容,同時保持 AI 不會影響品牌資產。
此 Omniverse 藍圖采用多模態方法,并結合使用 3D 作為英雄資產和簡單的環境幾何圖形,以及 2D 渲染通道,以便快速修復以完成受控場景。您可以通過蒙版來保持產品數字孿生的完整性,還可以通過更改攝像頭角度和縮放 3D 視窗來構圖鏡頭。
為精確的視覺生成式 AI 構建經 3D 調整的工作流程涉及以下幾個關鍵組件:
- 品牌內的英雄資產:最終成品資產,由藝術家打造,通常由品牌經理和藝術總監批準,應視為英雄資產。在本例中,我們提供了一臺簡單的意式特濃咖啡機。
- 簡單、無紋理的 3D 場景: 由 3D 藝術家提供,用于存放英雄資產以及控制布局和構圖。
- 自定義應用程序: 使用基于 Kit 106.2 的 Kit 應用程序模板 構建。
- 生成式 AI 微服務和 Kit 擴展程序:為您的自定義應用添加生成式 AI 功能。在這種情況下,擴散模型(例如 Stable Diffusion)負責修補。
- 解決方案測試: 驗證集成工作流程的功能和性能。
對于此工作流,我們專門探索了微服務,使您能夠使用生成式 AI,同時利用 OpenUSD 進行 3D 應用和工作流開發。
Omniverse 藍圖旨在實現可擴展和可定制。您可以在工作流中引入一些其他組件,如 PyTorch、pandas 和 LangChain 等。
- 大型多模態模型(LMM)+ ComfyUI:快速生成式文本轉圖像模型,可根據文本提示合成逼真圖像。
- Edify 360 NIM :Shutterstock 提供生成式 3D 服務的早期訪問預覽,用于生成 360 度高動態范圍圖像(HDRI)。該模型使用 Shutterstock 的許可創意庫在 NVIDIA Edify 上進行訓練。
- Edify 3D NIM :用于生成 3D 素材的 Shutterstock 生成式 3D 服務,用于場景裝飾的其他 3D 對象。使用 NVIDIA Edify 和 Shutterstock 許可的創意庫進行訓練。
- USD 代碼 :一個回答 OpenUSD 知識查詢并生成 USD Python 代碼的語言模型。
- USD Search :使用基于文本或圖像的輸入,對 OpenUSD 數據、3D 模型、圖像和資產進行 AI 驅動的搜索。
在 工作流程指南 結束后,您將能夠使用 AI 開發自己的自定義應用,從而為您的創意和營銷團隊提供支持和加速。所有微服務目前均可在 build.nvidia.com 上預覽,您可以在其中調用 API 進行評估。

利用 NVIDIA Omniverse 藍圖構建營銷生態系統
獨立軟件供應商(ISV)和生產服務機構的開發者正在基于 OpenUSD 構建新一代內容創作解決方案,該解決方案采用可控生成式 AI。
例如, Accenture Song 、 GRIP 、 Monks 、 WPP 和 Collective World 正在采用 Omniverse 藍圖來加速開發。
開發可擴展的人工智能解決方案,以創建符合品牌資產
此藍圖為您提供了如何構建可控的生成式 AI 應用的架構示例。您或您的客戶現在可以充分利用您的應用:
- 多模態 AI 生成的最終幀活動素材
- 為關鍵視覺效果快速構思和構思
- 批量處理提示輸入,根據從數據庫輸入的預定義文本提示生成可能數百個視覺輸出
通過實施此藍圖,您或您的客戶將獲得以下優勢:
- 加快上市時間: 可顯著縮短創建高分辨率品牌資產所需的時間,從而加快產品上市速度。
- 輕松定位: 支持即時創建本地化圖像,以幫助品牌滿足特定的文化趨勢或不同市場的需求。
- 提高工作效率: 使用 3D 數據的易于使用的工具可以降低傳統上與高保真資產創建相關的技術技能組合。
開始使用?
在本文中,我們介紹了用于精確視覺生成式 AI 的 3D 條件 的 NVIDIA Omniverse Blueprint,并向您展示了如何通過構建生成式 AI 應用程序來生成品牌準確的視覺資產和內容制作的方法。
有關更多信息,請參閱以下資源:
- 通過 NVIDIA API Catalog 中的交互式演示進行 3D 條件 ,實現精確的視覺生成式 AI 藍圖
- 通用版 USD 搜索 API ,包括可下載的 Helm 圖表,用于自行部署,以便在您自己的基礎架構上與您自己的數據進行交互。
- 參考架構 示例工作流程,以及實施藍圖的分步指南
- /NVIDIA-NIM-Agent-Blueprints/ GitHub 庫,包括工作流程指南(用于 3D 調整)
?
?