Image Recognition – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 09 Mar 2023 04:31:57 +0000 zh-CN hourly 1 196178272 新的 NVIDIA Metropolis 微服務快速跟蹤云原生視覺 AI 開發 http://www.open-lab.net/zh-cn/blog/new-nvidia-metropolis-microservices-fast-tracks-cloud-native-vision-ai-development/ Mon, 06 Mar 2023 04:30:14 +0000 http://www.open-lab.net/zh-cn/blog/?p=6409 Continued]]> 視覺 AI 驅動的應用程序在價值和行業采用率方面呈爆炸式增長。它們由成熟的人工智能開發人員和對人工智能完全陌生的開發人員開發。這兩類開發人員都面臨著更復雜的解決方案要求和更快的上市時間的挑戰。構建這些愿景 AI 解決方案需要一個可擴展的分布式架構和工具,以提高開發人員的生產力,并可供 AI 新手使用。 基于云原生微服務的設計特別適合滿足這些需求,并提供巨大的好處,如可擴展性、可維護性,以及可在各種環境中進行適應性和可部署性。 NVIDIA Metropolis Microservices is now open for early access ,提供云原生、可定制的構建塊,以開發視覺 AI 應用程序和服務。 Metropolis 微服務提供抽象的、云不可知的企業級構建塊,您可以通過 API 和行業標準接口自定義這些構建塊并將其集成到應用程序中。您可以在任何地方部署微服務,

Source

]]>
6409
使用 NVIDIA DeepStream 對特定幀區域應用推理 http://www.open-lab.net/zh-cn/blog/applying-inference-over-specific-frame-regions-with-nvidia-deepstream/ Wed, 27 Jul 2022 06:13:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4698 Continued]]> 在高分辨率輸入中檢測物體是計算機視覺中的一個眾所周知的問題。當感興趣的是框架的某個區域時,不需要對整個框架進行推理。解決這個問題有兩種方法: 在許多方面,第一種方法是困難的。訓練輸入量大的模型通常需要更大的主干,使整個模型更笨重。訓練或部署這樣的模型也需要更多的計算資源。較大的模型被認為不適合在較小的設備上部署邊緣。 第二種方法,將整個圖像劃分為塊,并對每個塊應用較小的模型,具有明顯的優勢。使用較小的模型,因此在訓練和推理中需要較小的計算能力。將模型應用于高分辨率輸入不需要再培訓。較小的模型也被認為有利于邊緣部署。 在這篇文章中,我們將討論如何 NVIDIA DeepStream 可以幫助將較小的模型應用于高分辨率輸入,以檢測特定的幀區域。 視頻監控系統用于解決各種問題,例如識別行人、車輛和汽車。如今, 4K 和 8K 攝像機用于捕捉場景細節。

Source

]]>
4698
為 NVIDIA MLPerf Training v2.0 性能提供動力的全堆棧優化 http://www.open-lab.net/zh-cn/blog/boosting-mlperf-training-performance-with-full-stack-optimization/ Thu, 30 Jun 2022 02:02:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4498 Continued]]> MLPerf benchmarks 由工業界、學術界和研究實驗室的人工智能領導者組成的聯盟開發,旨在提供標準、公平和有用的深度學習性能測量。 MLPerf 訓練側重于測量時間,以便為以下任務訓練一系列常用的神經網絡: 減少培訓時間對于加快部署時間、最小化總體擁有成本和最大化投資回報至關重要。 然而,與平臺性能一樣重要的是它的多功能性。訓練每個模型的能力,以及提供基礎設施可替代性以運行從訓練到推理的所有人工智能工作負載的能力,對于使組織能夠最大限度地實現其基礎設施投資的回報至關重要。 NVIDIA platform 具有全堆棧創新和豐富的開發人員和應用程序生態系統,仍然是唯一提交所有八個 MLPerf 訓練測試結果,以及提交所有 MLPerf 推理和 MLPerf 高性能計算( HPC )測試結果的系統。 在本文中,您將了解 NVIDIA 在整個堆棧中部署的方法,

Source

]]>
4498
使用 DiscoBox DL 框架分割沒有遮罩的對象并減少注釋工作量 http://www.open-lab.net/zh-cn/blog/segment-objects-without-masks-and-reduce-annotation-effort-using-the-discobox-dl-framework/ Thu, 24 Mar 2022 06:35:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3460 Continued]]> 實例分割是檢測和分割目標的一個核心視覺識別問題。在過去幾年中,該領域一直是計算機視覺領域的圣杯之一,其應用范圍廣泛,包括自動駕駛汽車( AV )、機器人技術、視頻分析、智能家居、數字人類和醫療保健。 注釋是對圖像或視頻中的每個對象進行分類的過程,是實例分割的一個具有挑戰性的組成部分。訓練 面具 R-CNN 等傳統實例分割方法需要同時使用對象的類標簽、邊界框和分割遮罩。 然而,獲取分割掩模既昂貴又耗時。例如, 可可數據集 需要大約 70000 小時的時間來注釋 200k 圖像,其中 55000 小時用于收集對象遮罩。 為了加快注釋過程, NVIDIA 研究人員開發了 DiscoBox 框架。該解決方案使用了一種弱監督學習算法,可以在訓練期間輸出高質量的實例分割,而無需掩碼注釋。 該框架直接從邊界框監控生成實例分段,而不是使用掩碼注釋直接監控任務。

Source

]]>
3460
計算機視覺指南:為何重要以及它如何幫助解決問題 http://www.open-lab.net/zh-cn/blog/guide-to-computer-vision-why-it-matters-and-how-it-helps-solve-problems/ Mon, 21 Mar 2022 06:40:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3372 Continued]]> 這篇文章是為了幫助初學者開發社區,尤其是那些對計算機視覺和計算機科學不熟悉的人。NVIDIA 認識到,通過計算機視覺和人工智能解決并受益于世界的視覺計算挑戰需要我們所有人。NVIDIA 很高興與 人工智能中的黑人女性 合作,并將此帖子獻給 人工智能中的黑人女性 。 計算機視覺在現實世界中的應用越來越廣泛,其應用也越來越具有挑戰性,并且正在改變其意義。計算機視覺已經以某種形式存在了幾十年,它正在成為一個越來越常見的短語,遍布世界各地和各個行業:計算機視覺系統、計算機視覺軟件、計算機視覺硬件、計算機視覺開發、計算機視覺管道、計算機視覺技術。 無論從字面上還是比喻上看,計算機視覺的術語和領域都超出了人們的想象。在特定的非人工智能實例中,計算機視覺也被稱為 vision AI 和傳統圖像處理,在制造業和工業用例中也被稱為 machine vision 。 簡言之,

Source

]]>
3372
利用 NVIDIA TAO 工具包和 Innotescus 進行遷移學習的策展數據 http://www.open-lab.net/zh-cn/blog/curating-data-for-transfer-learning-with-the-nvidia-tao-toolkit-and-innotescus/ Mon, 28 Feb 2022 06:23:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3103 Continued]]> 人工智能應用程序由機器學習模型提供動力,這些模型經過訓練,能夠根據圖像、文本或音頻等輸入數據準確預測結果。從頭開始訓練機器學習模型需要大量的數據和相當多的人類專業知識,這往往使這個過程對大多數組織來說過于昂貴和耗時。 遷移學習是從零開始構建定制模型和選擇現成的商業模型集成到 ML 應用程序之間的一種愉快的媒介。通過遷移學習,您可以選擇與您的解決方案相關的 pretrained model ,并根據反映您特定用例的數據對其進行再培訓。轉移學習在“定制一切”方法(通常過于昂貴)和“現成”方法(通常過于僵化)之間取得了正確的平衡,使您能夠用較少的資源構建定制的解決方案。 這個 NVIDIA TAO 工具包 使您能夠將轉移學習應用于預訓練的模型,并創建定制的、可用于生產的模型,而無需人工智能框架的復雜性。要訓練這些模型,必須有高質量的數據。 TAO 專注于開發過程中以模型為中心的步驟,

Source

]]>
3103
使用 NVIDIA TAO 和 NVIDIA DeepStream開發和部署您的自定義動作識別應用程序,而無需任何人工智能專業知識 http://www.open-lab.net/zh-cn/blog/developing-and-deploying-your-custom-action-recognition-application-without-any-ai-expertise-using-tao-and-deepstream/ Thu, 02 Dec 2021 06:08:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2536 Continued]]> 作為人類,我們每天都在不停地移動,做一些動作,比如走路、跑步和坐著。這些行為是我們日常生活的自然延伸。構建能夠捕獲這些特定動作的應用程序在體育分析領域、醫療保健領域、零售領域以及其他領域都非常有價值。 然而,構建和部署能夠理解人類行為的時間信息的人工智能應用程序既具有挑戰性又耗時,需要大量培訓和深入的人工智能專業知識。 在這篇文章中,我們將展示如何快速跟蹤 AI 應用程序的開發,方法是采用預訓練的動作識別模型,使用 NVIDIA TAO Toolkit 自定義數據和類對其進行微調,并通過 NVIDIA DeepStream 部署它進行推理,而無需任何 AI 專業知識。 要識別一個動作,網絡不僅要查看單個靜態幀,還要查看多個連續幀。這提供了理解操作的時間上下文。這是與分類或目標檢測模型相比的額外時間維度,其中網絡僅查看單個靜態幀。

Source

]]>
2536
使用 NVIDIA GPU 加速 AI 技術創建服裝檢測應用程序 http://www.open-lab.net/zh-cn/blog/creating-an-apparel-detection-app-with-nvidia-gpu-accelerated-ai-technologies/ Fri, 08 Oct 2021 08:11:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=1931 Continued]]> 這篇客串帖子由 Drishtic AI 首席開發者提交, Priti Gavali 和技術架構師, Archana Borawake 。 時裝業在新技術和不斷變化的消費趨勢方面正在發生許多變化。作為零售業增長最快的行業之一,時裝行業正在利用數據更好地了解消費者的服裝品味和偏好。 Drishtic AI 的解決方案使用計算機視覺來分析照片和視頻,解讀最流行的款式,并將數據編譯成對客戶有用的格式。 服裝公司可以利用這些數據來評估需求,并根據個人的年齡、性別和偏好來開發吸引他們的服裝。通過生產流行的款式,服裝公司可以減少浪費,創造一個更可持續的行業。 艾德里什蒂克使用 NVIDIA Metropolis 平臺開發支持人工智能的視頻分析應用程序。 Drishtic AI 的目標是使用先進的工具和全堆棧方法來實現更快的開發時間,

Source

]]>
1931
NVIDIA GTC :計算機視覺課程涵蓋零售、農業、醫療等領域 http://www.open-lab.net/zh-cn/blog/nvidia-gtc-computer-vision-sessions-span-retail-ag-healthcare-and-more/ Fri, 08 Oct 2021 06:47:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=1922 Continued]]> 查看開發者工具、加速研究、智能空間和在邊緣部署 AI 方面的最新 AI 愿景進展。 隨著許多行業的創新,不要錯過本次 GTC 會議將展示的所有激動人心的用例和發現。 NVIDIA GTC 于 11 月 8 日至 11 日運行,重點關注計算機視覺的所有方面,包括智能視頻分析( IVA )。免費注冊,包括主題演講,可參加 500 多場技術會議。準備好迎接另一次全球體驗,讓創新和卓越的頭腦聚集在一起! IVA 會議系列產品涵蓋了智能空間的應用,如體育場運營、制造、零售、智能交通系統、醫療保健、農業和自動機器。 開發人員會議還將展示如何使用 NVIDIA TAO 工具包增強 AI 開發工作流。除了推動跨行業“下一件大事”的 DeepStream SDK 6 . 0 的最新更新,還有 NVIDIA AI LaunchPad 的學習課程,

Source

]]>
1922
人人超碰97caoporen国产