]]>13339構建生成式 AI OpenUSD 應用,呈現準確品牌的營銷視覺效果
http://www.open-lab.net/zh-cn/blog/building-a-generative-ai-openusd-app-for-brand-accurate-marketing-visuals/
Tue, 19 Nov 2024 09:38:22 +0000http://www.open-lab.net/zh-cn/blog/?p=12205Continued]]>如今,品牌及其創意機構承受著巨大的壓力,需要大規模地創建和提供高質量、準確的產品圖片,從活動關鍵視覺效果到電子商務包裝截圖等。面向受眾的內容,如個性化和本地化視覺變化,增加了制作的復雜性。 制作成本、短時間線、資源和維護品牌身份都是營銷團隊創建更多資產和更具針對性的內容的重復障礙。 例如,意式特濃咖啡制造商可能希望在即將推出的產品中面向廣泛的受眾,從居住在城市的年輕專業人士到在鄉村享受退休生活的老一代。歷史上,這需要多個工作流程、地點、團隊和審查周期來執行,而這通常是不可能的,這會限制營銷團隊用于定位的可用內容。 為了大規模地為廣泛的受眾群體生成高質量、品牌準確的內容,創意團隊現在可以利用生成式 AI 工作流。將生成式 AI 集成到用于生成準確的視覺資產和制作內容的工具和應用中,可以為內容供應鏈帶來新的可能性和效率。 許多開發者已經在努力將其變為現實。 在本文中,
]]>12205利用 NVIDIA AI Blueprint 搭建視頻搜索和摘要智能代理
http://www.open-lab.net/zh-cn/blog/build-a-video-search-and-summarization-agent-with-nvidia-ai-blueprint/
Mon, 04 Nov 2024 06:33:13 +0000http://www.open-lab.net/zh-cn/blog/?p=11837Continued]]>本文最初于 2024 年 7 月 29 日發布,但已根據 NVIDIA AI Blueprint 信息進行了大量修改。 傳統的視頻分析應用及其開發工作流通常基于功能固定的、有限的模型構建,這些模型旨在僅檢測和識別一組預定義的對象。 借助 生成式 AI 、NVIDIA NIM 微服務和基礎模型,您現在可以使用更少的模型構建具有廣泛感知和豐富上下文理解的應用程序。 新型生成式 AI 模型,即視覺語言模型(VLM),為 視覺 AI 智能體 提供支持,這些智能體可以理解自然語言提示并執行視覺問答。通過結合 VLM、LLM 和最新的 Graph-RAG 技術,您可以構建功能強大的視覺 AI 智能體,從而實現對視頻的長篇理解。 這些可視化 AI 智能體將部署在工廠、倉庫、零售商店、機場、交叉路口等地。它們將幫助運營團隊利用從自然交互中生成的更豐富的見解做出更明智的決策。