視頻流/會議 – NVIDIA 技術博客

借助 AI 驅動的記錄和總結功能提高會議工作效率

Wed, 29 Nov 2023 06:04:50 +0000

會議是組織的生命線。它們促進協作和明智的決策。它們通過頭腦風暴和解決問題來消除孤島。它們還可以推進戰略目標和規劃。然而，實現這些目標的主要會議(尤其是涉及跨職能團隊和外部參與者的會議)可能具有挑戰性。需要將人員管理技能和熟練的文檔策略獨特地結合起來，以無縫促進決策制定并確保有效的會后任務執行。本文介紹了基于云原生微服務的架構，adam.ai。通過 NVIDIA 初創加速計劃，adam.ai 成為了一個全面的會議管理平臺，旨在為組織、團隊和專業人士的整個會議生命周期提供支持。該架構提供高可擴展性、低延遲和經濟高效的在線會議自動記錄服務。具體而言，adam.ai 利用了 NVIDIA 的技術。人工做筆記需要實時決定要記錄的信息和省略的信息。此外，即使對最熟練的人來說，在積極參與和細致的筆記之間取得平衡也會帶來挑戰。專注所需的耐久性，尤其是在漫長或復雜的討論期間，

Source

]]>

如何用合成數據訓練用于視覺檢測的目標檢測模型

Mon, 18 Sep 2023 02:47:50 +0000

人工智能正在迅速改變工業視覺檢測。在工廠環境中，目視檢查用于許多問題，包括在組裝過程中檢測缺陷和丟失或不正確的零件。計算機視覺可以幫助及早發現產品的問題，減少產品交付給客戶的機會。然而，對于邊緣人工智能開發人員來說，開發準確且通用的物體檢測模型仍然具有挑戰性。穩健的對象檢測模型需要訪問全面且具有代表性的數據集。在許多制造場景中，真實世界的數據集在捕捉實際場景的復雜性和多樣性時顯得不足。狹窄環境和有限變化的限制對訓練模型有效適應一系列情況提出了挑戰。團隊可以利用合成數據在與現實世界場景非常相似的多樣化隨機數據上訓練模型，以解決數據集差距。其結果是更準確、適應性更強的人工智能模型，可用于工業自動化、醫療保健和制造業等領域的廣泛邊緣人工智能應用。 Edge Impulse 是一個集成開發平臺，使開發人員能夠為邊緣設備創建和部署人工智能模型。它支持數據收集、預處理、

Source

]]>

使用 NVIDIA Holoscan for Media 進行軟件定義廣播

Thu, 14 Sep 2023 05:55:10 +0000

廣播行業正在經歷內容創建、管理、分發和消費方式的轉變。這一轉變包括從受固定功能設備約束的傳統線性工作流程轉變為靈活和混合的軟件定義系統，從而實現直播的未來。開發人員現在可以申請加入 NVIDIA Holoscan for Media，這是一個軟件定義的平臺，用于在本地、云端和邊緣開發和部署媒體應用程序。使用 Holoscan for Media，廣播公司和解決方案提供商可以利用最新的 IT 和資源調配技術，以及現代的基于容器的開發、編排和交付方法。 Holoscan for Media 是一個基于 IP 的解決方案，基于行業標準和 API，包括 SMPTE ST 2110、AMWA NMOS、RIST、SRT 和 NDI。該平臺集成了開源和無處不在的技術，打破了基于 SDI 和 FPGA 的系統的專有性和靈活性。它還可以將最新的功能，例如生成性 AI，

Source

]]>

使用 OpenUSD 和 Digital Twins 創造沉浸式活動

Mon, 11 Sep 2023 06:08:21 +0000

Moment Factory 是一家全球性的多媒體娛樂工作室，它結合了視頻、照明、建筑、聲音、軟件和互動方面的專業知識，為世界各地的觀眾創造身臨其境的體驗。從現場表演、多媒體表演到互動裝置，Moment Factory 以一些最令人敬畏和娛樂的體驗而聞名，這些體驗將人們聚集在現實世界中。其中包括令人眼花繚亂的視覺效果，如Billie Eilish 的比以往任何時候都幸福世界巡回演唱會，Lumina 夜間漫步在世界各地的自然遺址，以及AT&T Discovery District。 Moment Factory 擁有一支由 400 多名專業人士組成的團隊，在蒙特利爾、東京、巴黎、紐約和新加坡設有辦事處，已成為娛樂業的全球領導者。將這些體驗付諸實踐需要擁有不同專業的高技能專家組成的大型團隊，他們都使用獨特的工具。為了在高度復雜的生產過程中實現最佳效率，

Source

]]>

NVIDIA 視頻編解碼器 SDK 加速了新的視頻創建和流媒體功能

Wed, 24 May 2023 05:02:12 +0000

十多年來， NVIDIA GPU 一直采用稱為NVENC 和 NVDEC。它們具有高度并行化的架構，支持流行的編解碼器格式，并提供對 GPU 存儲器的直接訪問，以優化編碼和解碼操作。 GPU – 加速視頻意味著將視頻處理卸載到 NVENC 和 NVDEC ，減少 CPU 周期，并利用更優化的硬件單元。為了啟用 GPU 加速， NVIDIA 提供Video Codec SDK：支持高性能編碼和解碼的豐富 API 。去年， NVIDIA 推出了Ada Lovelace 架構，采用新的第八代 NVENC 。視頻編解碼器 SDK 已更新以支持AV1 encode在 NVIDIA Ada Lovelace 上，以及拆分編碼，以同時利用多個 NVENC 的功率。 Video Codec SDK 12.1是最新版本，現已上市。這篇文章重點介紹了 12 . 1 版本中支持的新功能，

Source

]]>

使用 CV-CUDA 提高基于人工智能的計算機視覺的吞吐量并降低成本

Thu, 04 May 2023 03:41:08 +0000

涉及基于人工智能的實時云規模應用程序計算機視覺正在迅速增長。用例包括圖像理解、內容創建、內容審核、映射、推薦系統和視頻會議。然而，由于對處理復雜性的需求增加，這些工作負載的計算成本也在增長。從靜止圖像到視頻的轉變現在也正在成為消費者互聯網流量的主要組成部分。鑒于這些趨勢，迫切需要構建高性能但具有成本效益的計算機視覺工作負載。基于人工智能的計算機視覺管道通常涉及圍繞人工智能推理模型的數據預處理和后處理步驟，這可能占整個工作負載的 50-80% 。這些步驟中常見的運算符包括以下內容：雖然開發人員可能會使用 NVIDIA GPU 來顯著加速他們管道中的人工智能模型推理，但預處理和后處理仍然通常使用基于 CPU 的庫來實現。這導致整個人工智能管道的性能出現瓶頸。通常是人工智能圖像或視頻處理管道一部分的解碼和編碼過程也可能在 CPU 上受到瓶頸，影響整體性能。

Source

]]>

使用新的 NVIDIA Triton 和 NVIDIA TensorRT 功能為您的 AI 推理提供動力

Thu, 23 Mar 2023 06:40:56 +0000

NVIDIA AI 推理軟件包括NVIDIA Triton 推理服務器，開源推理服務軟件，以及NVIDIA TensorRT，一個用于高性能深度學習推理的 SDK ，包括深度學習推理優化器和運行時。它們為所有人工智能深度學習用例提供加速推理。 NVIDIA Triton 還支持傳統的機器學習（ ML ）模型和 CPU 上的推理。這篇文章解釋了該軟件最近添加的關鍵新功能。 NVIDIA Triton 中的新功能包括 Py Triton 本機 Python 支持、模型分析器更新和 NVIDIA Triton 管理服務。 PyTriton 功能提供了一個簡單的接口，可以在 Python 代碼中使用 NVIDIA Triton InferenceServer 。 Py Triton 使 Python 開發人員能夠使用 NVIDIA Triton…

Source

]]>

NVIDIA Maxine 提升云端視頻會議

Wed, 22 Mar 2023 05:56:31 +0000

實時遠程通信已成為新常態，但許多上班族的視頻和音頻質量仍然很差，這影響了協作和人際交往。 NVIDIA Maxine 是專門為解決這些挑戰而開發的，它使用了最先進的人工智能模型，極大地提高了視頻會議通話的清晰度。這些功能在最近的 NVIDIA GTC 活動中得到了很大程度的展示。現在， NVIDIA Maxine 已經擴展到提供可以部署在私有或公共云中的微服務，使開發人員能夠利用遠程服務器的 GPU 能力。這篇文章涵蓋了最近的功能更新，以及微服務和 NVIDIA Maxine 瘦客戶端軟件的詳細信息，這些軟件可以有效地利用任何基于 Windows 的 PC 上的這些服務。 NVIDIA Maxine 是一套經過預訓練的人工智能模型，旨在改善視頻會議體驗。開發人員現在可以體驗、開發和部署 NVIDIA Maxine 型號。

Source

]]>

NVIDIA L4 GPU 實現 AI 視頻和 AI 推理性能的超級充電

Tue, 21 Mar 2023 06:59:15 +0000

NVIDIA T4 于 4 年前作為通用 GPU 引入主流服務器。 T4 GPU 已被廣泛采用，目前是 NVIDIA 數據中心中容量最大的 GPU s 。 T4 GPU 被部署到人工智能推理、云游戲、視頻和視覺計算的用例中。在 NVIDIA GTC 2023 主題演講中， NVIDIA 為人工智能工作負載推出了 several inference platforms ，包括 NVIDIA T4 的繼任者： NVIDIA L4 Tensor Core GPU 。 L4 GPU 現在是一款通用、節能的加速器，旨在滿足視頻、視覺計算、圖形、虛擬化、生成人工智能和邊緣計算的眾多應用的人工智能需求。在這篇文章中，我們介紹了與上一代（ T4 ）相比， L4 GPU 的主流服務器如何提供更多的 AI 視頻性能，并實現更多的視頻流。您將在從視頻流到藥物發現的各種用例中找到經過驗證的結果，

Source

]]>

通過 NVIDIA Maxine 眼神接觸改善視頻會議中的人際關系

Thu, 12 Jan 2023 09:44:20 +0000

視頻會議是幾個流媒體使用案例的核心，如 vlogging 、 vtubing 、網絡廣播，甚至遠程工作的視頻流媒體。為了創造一種更大的存在感，并從語言和非語言的線索中獲取信息，視頻會議技術必須讓用戶能夠清晰地看到和聽到。眼神交流在建立社交關系中起著關鍵作用，在面對面交談中，它意味著自信、聯系和關注。然而，在視頻會議場景中，持續進行眼神交流是不可行的。它要求用戶持續直視攝像頭，而不是電腦顯示器。如果你正在閱讀腳本或在電腦屏幕上查看數據，這可能會很困難。由于各種生理原因，保持眼神接觸有時也是一項挑戰。許多兒童和成人都很難進行和保持眼神交流。為了改善、增強和增強用戶體驗，我們開發了 NVIDIA Maxine Eye Contact 。該功能使用 AI 實時向用戶的網絡攝像頭輸入應用過濾器，并將他們的目光轉向攝像頭。

Source

]]>

新的 NVIDIA Maxine 微服務增強了大規模會議的實時音頻和視頻效果

Thu, 05 Jan 2023 02:22:00 +0000

在 CES 2023， NVIDIA Maxine 宣布了 SDK 更新和新的微服務，通過私有或公共云實現視頻會議中的清晰通信。 NVIDIA Maxine 是一套 GPU 加速 AI SDK 和云原生微服務，用于部署優化和加速的 AI 功能，增強音頻、視頻和增強現實（ AR ）效果，以實現實時通信。 Maxine 采用最先進的 NVIDIA AI 模型，通過清晰的通信和創新功能，提高了視頻會議中的個人影響力。 Maxine 中的高質量效果可以通過標準麥克風和網絡攝像頭實現。 NVIDIA 將于 2023 年 1 月發布兩個新的微服務：實時肖像和視頻效果。他們加入了更新的音頻效果微服務。 Maxine 微服務已經準備好使用容器化的應用程序包，這些應用程序包是從最先進的、預訓練的模型構建的，用于使用 AI 增強音頻、視頻和增強現實。這些容器包括所有必要的依賴項，

Source

]]>