Transfer Learning – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 13 Apr 2023 04:45:11 +0000 zh-CN hourly 1 196178272 都市聚焦: Lumeo 簡化視覺 AI 開發 http://www.open-lab.net/zh-cn/blog/metropolis-spotlight-lumeo-simplifies-vision-ai-development/ Wed, 12 Apr 2023 01:54:27 +0000 http://www.open-lab.net/zh-cn/blog/?p=6645 Continued]]> 全球最重要的空間部署了超過 10 億臺攝像機,這些攝像機是視頻和數據的關鍵來源。了解如何利用這些數據來提高我們的空間和流程的效率和安全性變得越來越重要。 Lumeo, NVIDIA Metropolis 合作伙伴,提供了一個“無代碼”視頻分析平臺,使開發人員和解決方案提供商能夠在幾分鐘內在邊緣或云中創建和交付自定義分析。它通過基于 web 的拖放工具、預先構建的分析構建塊、即用型和自定義人工智能模型以及與云服務的集成來實現這一點。 Lumeo 的平臺建立在NVIDIA pretrained models,NVIDIA TAO Toolkit,以及NVIDIA DeepStream SDK,為視覺人工智能解決方案的市場化鋪平了最快的道路。您可以使用任何 NVIDIA GPU 或 NVIDIA Jetson 邊緣 AI 系統在本地或云中快速部署和擴展定制的解決方案,

Source

]]>
6645
攜手共進:利用 Lexset 合成數據和 NVIDIA TAO 加速 AI 模型開發 http://www.open-lab.net/zh-cn/blog/better-together-accelerating-ai-model-development-with-lexset-synthetic-data-and-nvidia-tao/ Mon, 23 May 2022 08:20:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4173 Continued]]> 要開發準確的計算機視覺 AI 應用程序,您需要大量高質量的數據。對于傳統的數據集,您可能需要花費數月的時間來收集圖像、獲取注釋和清理數據。完成后,您可以找到邊緣案例并需要更多數據,從而重新開始循環。 多年來,這種循環阻礙了人工智能的發展,尤其是在計算機視覺領域。 Lexset 構建工具,使您能夠生成數據 來解決這個瓶頸。作為 AI 培訓周期的一部分,可以開發和迭代具有培訓數據的強大新工作流。 Lexset 的 Seahaven 平臺可以在幾分鐘內生成完全帶注釋的數據集,包括照片級真實感 RGB 圖像、語義分割和深度圖。迭代可以快速有效地提高模型的準確性。尋找異常事件或罕見情況的數據不再需要幾個月的時間。只需快速調整配置并生成新數據,即可使您的模型比以往任何時候都更好。 從 Seahaven 生成的合成數據可用于微調和定制 NVIDIA TAO 工具包中的預訓練模型。

Source

]]>
4173
使用 NVIDIA ISAAC Sim 和 NVIDIA TAO 開發和部署人工智能驅動的機器人 http://www.open-lab.net/zh-cn/blog/developing-and-deploying-ai-powered-robots-with-nvidia-isaac-sim-and-nvidia-tao/ Tue, 03 May 2022 09:42:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3848 Continued]]> 從制造汽車到幫助外科醫生和送披薩,機器人不僅自動化,而且將人類任務的速度提高了許多倍。隨著人工智能的出現,你可以建造更智能的機器人,它們可以更好地感知周圍環境,并在最少的人工干預下做出決策。 例如,一個用于倉庫的自動機器人將有效載荷從一個地方移動到另一個地方。它必須感知周圍的自由空間,檢測并避免路徑中的任何障礙,并做出“即時”決定,毫不拖延地選擇新路徑。 這就是挑戰所在。這意味著構建一個由人工智能模型支持的應用程序,該模型經過訓練和優化,可以在這種環境下工作。它需要收集大量高質量的數據,并開發一個高度精確的人工智能模型來驅動應用程序。這些是將應用程序從實驗室轉移到生產環境的關鍵障礙。 在這篇文章中,我們將展示如何使用 NVIDIA ISAAC 平臺和 TAO 框架解決數據挑戰和模型創建挑戰。你使用 NVIDIA ISAAC Sim ,一個機器人模擬應用程序,

Source

]]>
3848
利用 NVIDIA TAO 工具包和 Innotescus 進行遷移學習的策展數據 http://www.open-lab.net/zh-cn/blog/curating-data-for-transfer-learning-with-the-nvidia-tao-toolkit-and-innotescus/ Mon, 28 Feb 2022 06:23:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3103 Continued]]> 人工智能應用程序由機器學習模型提供動力,這些模型經過訓練,能夠根據圖像、文本或音頻等輸入數據準確預測結果。從頭開始訓練機器學習模型需要大量的數據和相當多的人類專業知識,這往往使這個過程對大多數組織來說過于昂貴和耗時。 遷移學習是從零開始構建定制模型和選擇現成的商業模型集成到 ML 應用程序之間的一種愉快的媒介。通過遷移學習,您可以選擇與您的解決方案相關的 pretrained model ,并根據反映您特定用例的數據對其進行再培訓。轉移學習在“定制一切”方法(通常過于昂貴)和“現成”方法(通常過于僵化)之間取得了正確的平衡,使您能夠用較少的資源構建定制的解決方案。 這個 NVIDIA TAO 工具包 使您能夠將轉移學習應用于預訓練的模型,并創建定制的、可用于生產的模型,而無需人工智能框架的復雜性。要訓練這些模型,必須有高質量的數據。 TAO 專注于開發過程中以模型為中心的步驟,

Source

]]>
3103
使用 NVIDIA TAO 工具包和 Appen 數據注釋平臺克服數據收集和擴充障礙 http://www.open-lab.net/zh-cn/blog/overcoming-data-collection-and-augmentation-roadblocks-with-tao-toolkit-and-appen-data-annotation-platform/ Tue, 25 Jan 2022 06:51:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2893 Continued]]> 從頭開始構建人工智能模型需要大量的數據、時間、金錢和專業知識。這與在人工智能領域取得成功的條件不符:快速上市,以及快速發展和定制解決方案的能力。 NVIDIA TAO 是一個人工智能模型調整框架,與從頭開始的培訓相比,它可以讓您利用生產質量、預培訓的人工智能模型,并在很短的時間內對其進行微調。 要進一步微調這些模型,或確認模型的精度,需要額外的高質量訓練數據。 Appen 是 TAO 的數據注釋合作伙伴,如果您沒有合適的可用數據,它可以訪問高質量的數據集和服務,為您的數據添加標簽和注釋,以滿足您的獨特需求。 在帖子中,我將向你展示如何使用 NVIDIA TAO 工具包 一個基于 CLI 的NVIDIA TAO 框架的解決方案,以及 AppEN 的數據標記平臺,以簡化整個培訓過程,并為特定用例創建高度定制的模型。 在您的團隊確定了要使用 ML 解決的業務問題后,

Source

]]>
2893
使用 NVIDIA TAO 和 NVIDIA DeepStream開發和部署您的自定義動作識別應用程序,而無需任何人工智能專業知識 http://www.open-lab.net/zh-cn/blog/developing-and-deploying-your-custom-action-recognition-application-without-any-ai-expertise-using-tao-and-deepstream/ Thu, 02 Dec 2021 06:08:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2536 Continued]]> 作為人類,我們每天都在不停地移動,做一些動作,比如走路、跑步和坐著。這些行為是我們日常生活的自然延伸。構建能夠捕獲這些特定動作的應用程序在體育分析領域、醫療保健領域、零售領域以及其他領域都非常有價值。 然而,構建和部署能夠理解人類行為的時間信息的人工智能應用程序既具有挑戰性又耗時,需要大量培訓和深入的人工智能專業知識。 在這篇文章中,我們將展示如何快速跟蹤 AI 應用程序的開發,方法是采用預訓練的動作識別模型,使用 NVIDIA TAO Toolkit 自定義數據和類對其進行微調,并通過 NVIDIA DeepStream 部署它進行推理,而無需任何 AI 專業知識。 要識別一個動作,網絡不僅要查看單個靜態幀,還要查看多個連續幀。這提供了理解操作的時間上下文。這是與分類或目標檢測模型相比的額外時間維度,其中網絡僅查看單個靜態幀。

Source

]]>
2536
語音識別:使用 NVIDIA Riva 生成準確的轉錄 http://www.open-lab.net/zh-cn/blog/speech-recognition-generating-accurate-transcriptions-using-riva/ Wed, 10 Nov 2021 07:11:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=2141 Continued]]> 這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 2 部分,請參見Speech Recognition: Customizing Models to Your Domain Using Transfer Learning. 有關第 3 部分,請參見Speech Recognition: Deploying Models to Production. 每天,電信、金融和統一通信即服務( UCaaS )等行業都會產生數百萬分鐘的音頻。這些音頻會議記錄可以轉錄,以便為呼叫中心代理提供實時建議,從客戶呼叫記錄中提取見解,或在視頻會議中生成實時字幕。 自動語音識別使您能夠將語音轉錄成文本。生成高質量的文字記錄是一項挑戰,因為這些技能需要理解特定于行業的術語、數百到數千分鐘特定于領域的培訓音頻以及實時運行的管道。 NVIDIA Riva 語音識別是一項技術,

Source

]]>
2141
語音識別:使用遷移學習為您的領域定制模型 http://www.open-lab.net/zh-cn/blog/speech-recognition-customizing-models-to-your-domain-using-transfer-learning/ Tue, 09 Nov 2021 10:37:40 +0000 http://www.open-lab.net/zh-cn/blog/?p=2131 Continued]]> 這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 1 部分,請參見 Speech Recognition: Generating Accurate Transcriptions Using NVIDIA Riva. 有關第 3 部分,請參見 Speech Recognition: Deploying Models to Production. 從頭開始創建一個新的人工智能深度學習模型是一個非常耗費時間和資源的過程。解決這個問題的一個常見方法是采用遷移學習。為了使這一過程更加簡單,NVIDIA TAO Toolkit,它可以將工程時間框架從 80 周縮短到 8 周。 TAO 工具包支持計算機視覺和對話 AI ( ASR 和 NLP )用例。 在本文中,我們將介紹以下主題: 跟隨 download the Jupyter notebook。

Source

]]>
2131
語音識別:將模型部署到生產中 http://www.open-lab.net/zh-cn/blog/speech-recognition-deploying-models-to-production/ Tue, 09 Nov 2021 10:33:28 +0000 http://www.open-lab.net/zh-cn/blog/?p=2128 Continued]]> 這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 1 部分,請參見Speech Recognition: Generating Accurate Transcriptions Using NVIDIA Riva.有關第 2 部分,請參見Speech Recognition: Customizing Models to Your Domain Using Transfer Learning NVIDIA Riva 是一款 AI 語音 SDK ,用于開發實時應用程序,如轉錄、虛擬助理和聊天機器人。它包括 NGC 中經過預訓練的最先進模型、用于在您的領域中微調模型的 TAO 工具包以及用于高性能推理的優化技能。 Riva 使使用 NGC 中的 Riva 容器或使用 Helm chart 在 Kubernetes 上部署模型變得更簡單。 Riva 技能由 NVIDIA TensorRT…

Source

]]>
2128
使用 NVIDIA TAO 工具包構建和部署對話 AI 模型 http://www.open-lab.net/zh-cn/blog/building-and-deploying-conversational-ai-models-using-tao-toolkit/ Tue, 09 Nov 2021 09:48:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2257 Continued]]> 對話式人工智能是一組技術,能夠在人類和設備之間基于最自然的界面(語音和自然語言)進行類似人類的交互。基于對話人工智能的系統可以通過識別語音和文本、在不同語言之間進行即時翻譯、理解我們的意圖以及以模仿人類對話的方式響應來理解命令。 構建對話式人工智能系統和應用程序很困難。為您的數據中心部署量身定制哪怕是單個組件來滿足您企業的需求就更難了。特定于領域的應用程序的部署通常需要幾個周期的重新培訓、微調和部署模型,直到滿足需求為止。 為了解決這些問題,本文介紹了三個關鍵產品: 由于這些產品的緊密集成,您可以將 80 小時的培訓、微調和部署周期壓縮到 8 小時。在本文中,我們將重點介紹 TAO 工具包,向您展示它如何支持各種遷移學習場景,以及它如何與 Riva 集成以部署對話 AI 模型和運行實時推理。 在對話人工智能系統中,有幾個組件,大致分為三個主要領域(圖 1 ):

Source

]]>
2257
使用 NVIDIA Riva 構建轉錄和實體識別應用程序 http://www.open-lab.net/zh-cn/blog/building-transcription-and-entity-recognition-apps-using-riva/ Tue, 09 Nov 2021 09:43:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2250 Continued]]> 在過去的幾個月里,我們中的許多人已經習慣于通過視頻電話看醫生。這當然很方便,但在通話結束后,醫生的重要建議就開始溜走了。我需要服用什么新藥?有什么副作用需要注意嗎? Conversational AI 可以幫助構建一個應用程序來轉錄語音,并突出該轉錄本中的重要短語。 NVIDIA Riva 是一款 SDK ,它可以減少您構建和部署可用于這些任務的最先進的深度學習模型的時間。 在本文中,我們將向您展示如何構建一個 web 應用程序,該應用程序可以從實時視頻聊天中轉錄語音,并在轉錄本中標記關鍵短語。視頻聊天使用 PeerJS ,這是一個基于 WebRTC 的開源對等聊天框架。對于實時轉錄,您使用 Riva 中的自動語音識別( ASR )。標記成績單中的關鍵短語使用命名實體識別( NER ),也來自 Riva 。我們還向您展示了如何使用來自醫學領域的數據來訓練 NER 模型。

Source

]]>
2250
人人超碰97caoporen国产