Image / Video Detection & Recognition – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Wed, 18 Sep 2024 07:39:17 +0000 zh-CN hourly 1 196178272 借助 NVIDIA Maxine 和 Texel 實現大規模協調創新 http://www.open-lab.net/zh-cn/blog/orchestrating-innovation-at-scale-with-nvidia-maxine-and-texel/ Mon, 16 Sep 2024 07:35:49 +0000 http://www.open-lab.net/zh-cn/blog/?p=11264 Continued]]> NVIDIA Maxine AI 開發者平臺是一套 NVIDIA NIM 微服務、云加速微服務和 SDK,可以提供用于增強實時視頻和音頻的先進功能。NVIDIA 合作伙伴使用 Maxine 功能打造更好的虛擬交互體驗,并改善與其應用的人類連接。 在虛擬環境中很少進行和保持眼神交流,因為在舉行會議或制作視頻時,通常很難將目光與攝像頭對齊;分心、腳本、側面注釋和其他因素增加了保持眼神交流的挑戰。 Maxine 眼神交流通過將用戶的目光與攝像頭對齊來模擬眼神交流,并增加互動和聯系,來解決此問題。有關更多信息,請參閱 NVIDIA Maxine 提升云端視頻會議效果。 將 Maxine 功能集成到應用程序中,有幾個選項,稍后將在本文中進行概述。Texel 是一個 AI 平臺,提供云原生 API,可幫助您擴展和優化圖像和視頻處理的工作流,使使用云的小型開發者能夠更輕松、

Source

]]>
11264
NVIDIA TAO 5.5 帶來新基礎模型和增強訓練功能 http://www.open-lab.net/zh-cn/blog/new-foundational-models-and-training-capabilities-with-nvidia-tao-5-5/ Wed, 28 Aug 2024 06:23:45 +0000 http://www.open-lab.net/zh-cn/blog/?p=11078 Continued]]> NVIDIA TAO 是一個旨在簡化和加速 AI 模型開發和部署的框架。它使您能夠使用預訓練模型,使用自己的數據微調模型,并針對特定用例優化模型,而無需深入的 AI 專業知識。 TAO 與 NVIDIA 硬件和軟件生態系統無縫集成,提供用于高效 AI 模型訓練、部署和推理的工具,并加速 AI 驅動應用程序的上市時間。 圖 1 顯示 TAO 支持 PyTorch、TensorFlow 和 ONNX 等框架。訓練可以在多個平臺上完成,而生成的模型可以部署在 GPU、CPU、MCU 和 DLA 等各種推理平臺上。 NVIDIA 剛剛發布了 TAO 5.5,引入了先進的基礎模型和突破性功能,可增強任何 AI 模型開發。新的功能包括以下內容: 在本文中,我們將更詳細地討論 TAO 5.5 的新功能。 NVIDIA TAO 集成了開源、基礎和專有模型,

Source

]]>
11078
簡化攝像頭校準,提高 AI 驅動的多攝像頭跟蹤能力 http://www.open-lab.net/zh-cn/blog/simplifying-camera-calibration-to-enhance-ai-powered-multi-camera-tracking/ Tue, 27 Aug 2024 07:21:55 +0000 http://www.open-lab.net/zh-cn/blog/?p=11098 Continued]]> 這篇文章是關于構建多攝像頭追蹤視覺AI應用的系列文章中的第三篇。我們將在第一部分和第二部分中介紹整體端到端工作流程和微調流程,以提高系統準確性。 NVIDIA Metropolis 是一個應用框架和一套開發者工具,可利用 AI 進行各行各業的視覺數據分析。其多攝像頭追蹤參考 AI 工作流由云原生 NVIDIA Metropolis 微服務提供支持,可跨多個攝像頭實現高級物體追蹤和定位。本文討論了攝像頭校準、如何使用 NVIDIA Metropolis 攝像頭校準工具包校準真實攝像頭,以及如何使用 NVIDIA Omniverse 擴展程序校準合成攝像頭。 攝像頭校正是確定特定攝像頭參數或估計攝像頭特征的過程。攝像頭校正可以將攝像頭在 2D 中看到的內容轉換為真實的坐標系統,它是許多基于視覺的應用程序的基礎。例如,在創建多攝像頭跟蹤應用程序時,

Source

]]>
11098
利用 NVIDIA Maxine AI 開發者平臺和 VideoRequest 實現視頻通信升級 http://www.open-lab.net/zh-cn/blog/elevating-video-communication-with-the-nvidia-maxine-ai-developer-platform-and-videorequest/ Mon, 12 Aug 2024 06:52:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=10986 Continued]]> 有效的視頻通信對每個在線溝通者來說都非常重要。對企業、教育工作者和內容創作者而言,這一點尤為關鍵。 NVIDIA Maxine 是一套 NVIDIA 加速的 SDK 集合,是云原生的容器化 NVIDIA NIM 微服務,用于部署 AI 功能,以增強視頻會議、數字人、虛擬存在和內容創作的實時音頻和視頻。Maxine 將繼續助力您突破智能實時視頻增強的極限。 在本文中,我們展示了 NVIDIA Inception 計劃合作伙伴 VideoRequest 如何使用 Maxine AI 開發者平臺將復雜的實時視頻編輯工具引入其平臺,從而使最終用戶能夠專注于他們想要發送的消息,而不是視頻設置或處理工具。 VideoRequest 是一項 AI 增強型視頻服務,用戶可以在其中輕松創建、編輯和分享視頻,用于客戶感言、宣傳、營銷、培訓或活動。

Source

]]>
10986
人工智能增強的導航圖為大型船舶提供更安全的水域 http://www.open-lab.net/zh-cn/blog/ai-enhanced-navigation-charts-safer-waters-for-massive-ships/ Tue, 25 Jun 2024 05:12:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=10426 Continued]]> 海事初創公司Orca AI憑借其 AI-powered 導航系統開創了海上安全的先河,該系統提供實時視頻處理,幫助船員在擁擠的水域和低能見度條件下做出數據驅動的決策。 每年,數千艘價值 1 億英鎊的大型船只運送價值 14 萬億美元的貨物,穿越世界海洋和水道,努力遵守緊迫的最后期限。每天,事故都在發生或勉強避免。僅在 2023 年,就記錄了 4000 多起安全事件,包括碰撞和近距離碰撞。 該導航模塊稱為 SeaPod,配有五個高清攝像頭用于白天觀看和三個熱像儀用于夜間觀看。即使在霧蒙蒙的條件下,SeaPod 也可以分析和注釋實時視頻,為航海家提供關于八海里外物體的重要見解。然后,注釋后的數據包括其他船只的相對大小和速度信息,顯示在船只駕駛室的計算機屏幕上。 奧卡人工智能是 NVIDIA 針對尖端初創公司的 Inception 計劃的一部分。其云連接、

Source

]]>
10426
借助 AI、可感知表情的 OCR 和 Snapchat 的 Screenshop 增強服裝購物體驗 http://www.open-lab.net/zh-cn/blog/enhancing-the-apparel-shopping-experience-with-ai-emoji-aware-ocr-and-snapchats-screenshop/ Fri, 17 May 2024 05:08:29 +0000 http://www.open-lab.net/zh-cn/blog/?p=10114 Continued]]> 是否曾在照片中看到有人穿著一件炫酷的襯衫或獨特的服裝,并想知道他們是從哪里買來的?價格是多少?也許您甚至考慮過自己買一件。 這項挑戰激發了 Snap 的 ML 工程團隊推出 Screenshop,這是 Snapchat 應用中的一項服務,該服務使用 AI 在線定位并推薦與圖像中看到的風格相匹配的時尚商品。 Screenshop 于 2021 年集成到 Snapchat 應用中。它使用開源物體檢測和圖像分類模型開發,該模型由 Snap 的 ML 工程師在內部進行了微調。該模型檢測圖像中顯示的服裝項目類型,然后將其傳遞到時尚嵌入模型,該模型使用相似度搜索在時尚目錄中找到外觀相似的項目。 Screenshop 的 AI 制作流程最初使用 TensorFlow 構建和提供,TensorFlow 是一種廣泛使用的開源框架,用于開發機器學習和人工智能應用程序。

Source

]]>
10114
NVIDIA DeepStream 7.0 里程碑式發布,用于下一代視覺 AI 開發 http://www.open-lab.net/zh-cn/blog/nvidia-deepstream-7-0-milestone-release-for-next-gen-vision-ai-development/ Tue, 14 May 2024 06:35:57 +0000 http://www.open-lab.net/zh-cn/blog/?p=9984 Continued]]> NVIDIA DeepStream 是一個功能強大的 SDK,可以解鎖 GPU 加速的構建塊,以構建端到端的視覺 AI 管道。憑借 40 多個現成的插件,您可以輕松部署具有尖端 AI 推理、對象跟蹤和流行的物聯網消息代理(如 REDIS、Kafka 和 MQTT)無縫集成的完全優化的管道。 DeepStream 提供直觀的 REST API 來控制您的 AI 管道,無論是部署在遠端還是云端。 DeepStream 7.0 的最新版本是我們迄今為止最重要的版本之一,旨在為您在生成人工智能時代提供突破性的功能。此版本包含旨在加速下一代應用程序開發的創新功能。 發布亮點包括以下內容: 立即下載 DeepStream 7.0 版 。 在構建視覺人工智能應用程序時,業務的首要任務是優化人工智能管道,以獲得一流的性能。無論你是一名經驗豐富的職業選手,

Source

]]>
9984
借助適用于 Jetson 的 NVIDIA Metropolis 微服務,將生成式 AI 引入邊緣 http://www.open-lab.net/zh-cn/blog/bringing-generative-ai-to-the-edge-with-nvidia-metropolis-microservices-for-jetson/ Tue, 23 Jan 2024 04:24:17 +0000 http://www.open-lab.net/zh-cn/blog/?p=8814 Continued]]> 適用于 Jetson 的 NVIDIA Metropolis 微服務提供了一套易于部署的服務,使您能夠使用最新的 AI 方法快速構建生產級視覺 AI 應用。 本文將介紹如何開發和部署生成式 AI 應用程序,這些應用程序在 NVIDIA Jetson 邊緣 AI 平臺上運行,并通過 Metropolis 微服務進行管理。您可以通過參考示例(這些示例可以作為構建任何模型的一般指南)來進行探索。 參考示例使用獨立的零射檢測 NanoOwl 應用,并將其與 適用于 Jetson 的 Metropolis 微服務 相結合,以便您可以在生產環境中快速構建原型并進行部署。 生成式 AI 是一種機器學習技術,它使模型能夠以比之前方法更開放的方式理解世界。 大多數生成式 AI 的核心是基于 Transformer 的模型,該模型已在互聯網規模的數據上進行訓練。

Source

]]>
8814
新的 NVIDIA NeMo 框架功能和 NVIDIA H200 強效助力 LLM 訓練性能和通用性 http://www.open-lab.net/zh-cn/blog/new-nvidia-nemo-framework-features-and-nvidia-h200-supercharge-llm-training-performance-and-versatility/ Mon, 04 Dec 2023 05:37:31 +0000 http://www.open-lab.net/zh-cn/blog/?p=8419 Continued]]> AI 在規模、復雜性和多樣性方面的快速增長推動了對 大型語言模型 (LLM) 訓練性能的不斷需求。要提供出色的性能,需要能夠在整個數據中心規模上高效地訓練模型。這是通過技術堆棧的每一層 — 包括芯片、系統和軟件 — 的卓越工藝來實現的。 我們的 NVIDIA NeMo 框架 是一個端到端的云原生框架,旨在構建、自定義和部署生成式 AI 模型。它整合了一系列先進的并行技術,以實現大規模 LLM 的高效訓練。 實際上,NeMo 支持 NVIDIA 最近在 MLPerf 訓練 行業標準基準測試中提交的出色 GPT-3 1750 億參數性能數據,每個 H100 GPU 可實現高達 797 TFLOPS 的性能。此外,在 NVIDIA 提交的最大規模測試中,使用了前所未有的 10752 個 H100 Tensor Core GPU,實現了創紀錄的性能和近線性的性能擴展。

Source

]]>
8419
人人超碰97caoporen国产