新手技術 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Tue, 27 Feb 2024 23:11:35 +0000 zh-CN hourly 1 196178272 構建由 LLM 提供支持的 API Agent 來執行任務 http://www.open-lab.net/zh-cn/blog/build-an-llm-powered-api-agent-for-task-execution/ Wed, 21 Feb 2024 04:27:48 +0000 http://www.open-lab.net/zh-cn/blog/?p=8923 Continued]]> 長期以來,開發者一直在構建 Web 應用程序等界面,使用戶能夠利用正在構建的核心產品。要了解如何在您的大型語言模型(LLM) 應用程序中實現這一點,請參閱之前的博文,為數據分析構建由 LLM 提供支持的數據代理。在本文中,我將討論一種將自由形式對話添加為具有 API 的另一個接口的方法。該方法有助于實現與任何 API 進行細致入微的對話式交互的解決方案。 如果您想了解關于 LLM 代理的基本知識以及如何構建它們,請閱讀LLM 智能體簡介和構建您的首個 LLM 智能體應用。 API 或執行代理是為執行目標而設計的。這些代理通過使用一組預定義的執行函數來執行用戶請求的任務或一組任務。基于數據源回答用戶的問題是其中的一個重要部分。另一個重要部分是執行用戶(人類)或另一個代理(機器)的需求。 傳統上,這是通過 API 和某種形式的應用邏輯和交互層(例如 Web…

Source

]]>
8923
構建 LLM 支持的數據代理以進行數據分析 http://www.open-lab.net/zh-cn/blog/build-an-llm-powered-data-agent-for-data-analysis/ Tue, 20 Feb 2024 05:19:12 +0000 http://www.open-lab.net/zh-cn/blog/?p=8952 Continued]]> AI 智能體是一個由規劃功能、內存和工具組成的系統,用于執行用戶請求的任務。對于數據分析或與復雜系統交互等復雜任務,您的應用可能依賴于不同類型智能體之間的協作。有關更多背景信息,請參閱 LLM 智能體簡介 和 構建您的首個 LLM 智能體應用。 本文介紹了構建準確的 LLM 應用(可在查詢時處理細致入微的數據分析任務)所需的代理類型。本文將介紹構建數據分析代理應用(包括代碼片段)的示例用例。最后,本文將介紹 AI 開發者在優化和構建 LLM 代理應用時需要考慮的一些注意事項。 首先,本節介紹兩種主要類型的 LLM 代理及其工作原理 – 數據代理和 API 或執行代理。我還將介紹代理集群用例,其中涉及多個代理合作解決問題。請注意,這些代理類型在某種程度上代表頻譜的端部。可以為特定用例創建混合的專用代理。 數據代理通常專為提取目標而設計。換言之,

Source

]]>
8952
體驗 NVIDIA cuOpt 加速優化,提高運營效率 http://www.open-lab.net/zh-cn/blog/experience-nvidia-cuopt-accelerated-optimization-to-boost-operational-efficiency/ Mon, 19 Feb 2024 05:47:34 +0000 http://www.open-lab.net/zh-cn/blog/?p=8957 Continued]]> 本周的 Model Monday 版本亮點是 NVIDIA cuOpt,這是一款創新的加速優化引擎,專為幫助團隊解決復雜的路線規劃問題而設計。它為組織提供了重塑物流、運營研究、運輸和供應鏈優化的能力。NVIDIA cuOpt 支持多種物流優化用例,包括: 最終,cuOpt 可以幫助組織增加收入、降低成本并提高客戶滿意度。 本文介紹了兩種探索 cuOpt 功能的方法:使用 NVIDIA AI 基礎模型和端點,以及使用 NVIDIA LaunchPad。 NVIDIA AI 基礎模型針對企業生成式 AI 進行了優化。您可以與NVIDIA cuOpt通過 API 和基于用戶界面的演示使用樣本數據。這是一個開放訪問平臺,可在托管環境中使用,因此您不需要使用具有 GPU 加速功能的服務器。 即使對于那些可能不熟悉優化的人來說,也很容易開始使用 cuOpt.

Source

]]>
8957
借助加速網絡實現數據中心現代化 http://www.open-lab.net/zh-cn/blog/modernizing-the-data-center-with-accelerated-networking/ Tue, 30 Jan 2024 04:05:10 +0000 http://www.open-lab.net/zh-cn/blog/?p=8861 Continued]]> 加速網絡將 CPU、GPU、DPU(數據處理單元)或 SuperNIC 組合成加速計算結構,專門設計用于優化網絡工作負載。它使用專用硬件來卸載要求嚴苛的任務,以增強服務器功能。隨著 AI 和其他新工作負載的復雜性和規模不斷增加,對加速網絡的需求變得至關重要。 數據中心作為計算的新單元,隨著網絡服務對CPU壓力的增加,現代工作負載對網絡基礎設施提出了新的挑戰。網絡基礎設施需要具備敏捷性、自動化和可編程性,并配備加速器和卸載功能,這些是充分發揮人工智能技術潛力和推動創新的關鍵。 本文將探討加速網絡技術在數據中心中的優勢和實施策略,并重點介紹其在提升性能、可擴展性和效率方面的作用。 網絡加速需要優化網絡的各個方面,包括處理器、網絡接口卡 (NIC)、交換機、線纜、光學和網絡加速軟件。利用無損網絡、遠程直接內存訪問 (RDMA)、動態路由、擁塞控制、性能隔離和網絡計算,

Source

]]>
8861
借助 NVIDIA AI Enterprise 推進生產級 AI 發展 http://www.open-lab.net/zh-cn/blog/advancing-production-ai-with-nvidia-ai-enterprise/ Thu, 25 Jan 2024 04:22:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=8872 Continued]]> 盡管許多企業將利用人工智能的潛力作為優先事項,但開發和部署人工智能模型需要時間和精力。通常,必須克服將模型投入生產的挑戰,這對于任務關鍵型業務運營尤為重要。根據IDC 研究,只有 18% 的受訪企業能夠在一個月內將 AI 模型投入生產。 本文探討了降低 AI 部署速度的挑戰,并介紹了使用一致、安全且可靠的平臺加速將 AI 投入生產之旅的優勢。 開源軟件(OSS)在推動人工智能(AI)的采用方面發揮著至關重要的作用。根據2023 年 10 月的現狀報告,與生成式 AI 相關的公共 GitHub 項目在 2023 年達到了 65000 個,同比增長了 249%。盡管開源社區推動了 AI 時代的發展,但在構建 AI 應用程序中使用的各種 OSS 使得維護可靠的企業級 AI 軟件堆棧成為一項復雜且資源密集型的工作,類似于維護開源操作系統的難度。 例如,

Source

]]>
8872
借助 NVIDIA AI 軟件構建企業級 AI http://www.open-lab.net/zh-cn/blog/build-enterprise-grade-ai-with-nvidia-ai-software/ Wed, 24 Jan 2024 03:57:48 +0000 http://www.open-lab.net/zh-cn/blog/?p=8792 Continued]]> 在推出 ChatGPT 后,全球各地的企業開始意識到 AI 的優勢和功能,并競相將其應用到工作流程中。 隨著這種采用的加速,企業不僅必須跟上 AI 的快速發展,而且還必須解決優化、可擴展性和安全性等相關挑戰。 企業 AI 開發之旅通常從數據 ETL (提取、轉換、加載)階段開始,在此期間準備用于訓練的數據。接下來是訓練 AI 模型。模型完成訓練后,接下來的步驟包括部署和運行推理。企業需要在每個階段使用經過優化的安全軟件來構建生產就緒型 AI 應用。 NVIDIA NGC 目錄 通過以容器形式提供一系列 GPU 優化的軟件和 SDK,幫助企業加速其 AI 開發。 目錄中的一些熱門容器包括用于數據 ETL 階段的 RAPIDS,以及用于模型開發階段的 TensorFlow 和 PyTorch。此外,還有用于模型部署階段的 NVIDIA TensorRT 和…

Source

]]>
8792
借助 NVIDIA Quantum InfiniBand 簡化 AI 網絡運營 http://www.open-lab.net/zh-cn/blog/simplifying-network-operations-for-ai-with-nvidia-quantum-infiniband/ Tue, 23 Jan 2024 04:18:58 +0000 http://www.open-lab.net/zh-cn/blog/?p=8809 Continued]]> 一個常見的技術誤區是,性能和復雜性直接相關。也就是說,高性能的實現也是實現和管理最具挑戰性的。但是,在考慮數據中心網絡時,情況并非如此。 與以太網相比,InfiniBand 可能聽起來令人生畏且新奇,但它實際上是更易于部署和維護的,因為它從一開始就是為了實現最高性能而設計的。當您考慮 AI 基礎設施的連接時,InfiniBand 集群操作和維護指南可以幫助您盡可能簡化全棧 InfiniBand 網絡的設置和操作。 本指南全面介紹了簡化網絡運營的基本步驟,特別詳細介紹了如何使用 NVIDIA Unified Fabric Manager(UFM)來協助初始配置和持續維護計劃,適用于第 0 天、第 1 天和第 2 天的網絡運營。 UFM 是一個功能強大的工具集,具有廣泛的遙測和分析功能。但是,開始使用 UFM 了解集群監控和管理的基礎知識不需要任何高級前提條件或專業知識。

Source

]]>
8809
強大的場景文本檢測和識別:簡介 http://www.open-lab.net/zh-cn/blog/robust-scene-text-detection-and-recognition-introduction/ Tue, 16 Jan 2024 06:53:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=8774 Continued]]> 識別和識別自然場景和圖像中的文本對于視頻標題文本識別、檢測車載攝像頭的標牌、信息檢索、場景理解、車牌識別以及識別產品文本等用例變得非常重要。 大多數這些用例都需要近乎實時的性能。常用的文本提取技術包括使用光學字符識別 (OCR) 系統。但是,大多數免費的商用 OCR 系統都經過訓練,可以識別文檔中的文本。在識別自然場景或帶字幕的視頻(如圖像透視、反射、模糊等)中的文本方面存在許多挑戰。 在本系列的下一篇文章中,強大的場景文本檢測和識別:實施,討論了如何使用先進的深度學習算法和技術(例如增量學習和微調)實現 STDR 工作流。第三篇博文強大的場景文本檢測和識別:推理優化,涵蓋了為您的 STDR 工作流提供生產就緒型優化和性能。 通常,文本提取過程涉及以下步驟: 由于文本外觀的可變性(例如曲率、方向和失真),識別自然場景圖像中的不規則文本可能具有挑戰性。

Source

]]>
8774
強大的場景文本檢測和識別:實施 http://www.open-lab.net/zh-cn/blog/robust-scene-text-detection-and-recognition-implementation/ Tue, 16 Jan 2024 06:46:22 +0000 http://www.open-lab.net/zh-cn/blog/?p=8764 Continued]]> 要使場景文本檢測和識別適用于不規則文本或特定用例,您必須完全控制模型,以便根據用例和數據集執行增量學習或微調。請記住,此工作流是場景理解、基于 AI 的檢查和文檔處理平臺的主要構建塊。它應該準確且低延遲。 在本系列的第一篇文章中,強大的場景文本檢測和識別:簡介 討論了穩健的場景文本檢測和識別(STDR)在各行各業中的重要性以及所面臨的挑戰。第三篇博文 強大的場景文本檢測和識別:推理優化 涵蓋了 STDR 工作流的生產就緒型優化和性能。 在這篇博文中,我們決定采用高度精確的先進深度學習模型。為了確保準確性并維持較低的端到端延遲,我們采用了以下工具和框架來執行模型推理優化:NVIDIA TensorRT 和 ONNX Runtime。為了確保標準模型能夠被部署和執行,同時保證具有可擴展性的高性能推理,我們還選擇使用了 NVIDIA Triton 推理服務器。 為了訓練模型,

Source

]]>
8764
強大的場景文本檢測和識別:推理優化 http://www.open-lab.net/zh-cn/blog/robust-scene-text-detection-and-recognition-inference-optimization/ Tue, 16 Jan 2024 06:41:55 +0000 http://www.open-lab.net/zh-cn/blog/?p=8759 Continued]]> 在本文中,我們將深入探討推理優化過程,以在推理階段提高機器學習模型的性能和效率。我們將討論所采用的技術,例如推理計算圖形簡化、量化和降低精度。我們還展示了場景文本檢測和識別模型的基準測試結果,其中比較了 ONNX 運行時 和 NVIDIA TensorRT 使用 NVIDIA Triton 推理服務器。 最后,我們總結了優化深度學習模型對于推理的重要性,以及使用端到端 NVIDIA 軟件解決方案的優勢,NVIDIA AI Enterprise 用于構建高效可靠的場景文本 OCR 系統。 在本系列的第一篇文章中,強大的場景文本檢測和識別:簡介 討論了穩健場景文本檢測和識別(STDR)在各行各業中的重要性以及所面臨的挑戰。第二篇博文 強大的場景文本檢測和識別:實施 并討論了如何使用先進的深度學習算法和技術(如增量學習和微調)實現 STDR 工作流。

Source

]]>
8759
借助 NVIDIA Maxine 體驗實時音頻和視頻通信 http://www.open-lab.net/zh-cn/blog/experience-real-time-audio-and-video-communication-with-nvidia-maxine/ Wed, 10 Jan 2024 05:21:11 +0000 http://www.open-lab.net/zh-cn/blog/?p=8643 Continued]]> 我們的 NVIDIA Maxine 開發者平臺通過為開發者和企業提供各種低代碼實施方案,重新定義了視頻會議和編輯。其中包括 GPU 加速的 AI 微服務、SDK 和 NVIDIA 托管的 API 端點,用于實時 AI 增強音頻和視頻流。 最新版本的 Maxine 開發者平臺帶來了語音字體功能的搶先體驗、實時肖像視頻的改進,以及 Maxine 眼神交流功能的升級。此外,Video Live Portrait 和 Voice 字體功能現已在 NVIDIA NGC 目錄 中提供。您現在可以在 NVIDIA 加速的云基礎設施上,體驗 Maxine 預訓練的生成式 AI 模型的實際應用。 NVIDIA AI 基礎模型 Maxine 等公司展示了企業現在如何連接其應用,以讀取和集成 NVIDIA Foundations API 端點,并快速創建和部署性能優化的 AI 模型,

Source

]]>
8643
采用分幀編碼和 NVIDIA Ada Lovelace 架構的 8K60 視頻編碼 http://www.open-lab.net/zh-cn/blog/video-encoding-at-8k60-with-split-frame-encoding-and-nvidia-ada-lovelace-architecture/ Fri, 05 Jan 2024 06:03:51 +0000 http://www.open-lab.net/zh-cn/blog/?p=8679 Continued]]> 得益于攝像頭和顯示技術的進步,現在可以在 8K 分辨率和每秒 60 幀 (FPS) 下截取視頻片段和玩游戲。RED Digital Cinema、Nikon 和 Canon 等主要的領先多媒體公司已經為消費者和專業市場推出了 8K60 攝像頭。 在顯示器方面,8K60 采用最新的 HDMI 2.1 標準,現已得到廣泛應用,支持游戲顯示器和智能電視。雖然 8K60 提供 驚人的畫質和清晰度,但在傳輸和存儲時消耗更多數據會帶來巨大的成本。 因此,快速編解碼器在彌合傳感器和顯示器之間的差距方面至關重要。為了促進 8K60 的廣泛應用,NVIDIA Ada Lovelace GPU 架構提供了 NVENC 加速視頻編碼性能的引擎,同時保持高畫質。(NVIDIA RTX 4090 和 4080 分別提供兩個和三個 NVENC,而 NVIDIA RTX 6000 Ada…

Source

]]>
8679
問答:電影場景中的實時光線追蹤 http://www.open-lab.net/zh-cn/blog/qa-real-time-ray-tracing-in-a-cinematic-scene/ Wed, 20 Dec 2023 04:33:09 +0000 http://www.open-lab.net/zh-cn/blog/?p=8539 Continued]]> 六年前,實時光線追蹤被視為白日夢。當時,電影級渲染需要計算機農場在一夜之間緩慢烘焙每幀圖像,這是一個艱苦的過程。 到 2018 年,這一性能水平可以實時實現,達到每秒 45 幀,使視頻游戲等應用程序能夠在圖形質量方面實現巨大飛躍。 作為我們 RTX 500 慶典 的一部分,我們想回顧一下 NVIDIA 的 Project Sol。這個實時電影級系列展示了視覺效果,其保真度達到了觀眾在高端動畫電影中才能看到的水平。請在下面查看: 該系列的其他視頻 視頻 – Project Sol 第 2 部分:由 NVIDIA RTX 支持的實時光線追蹤電影級場景 視頻 – Project Sol 第 3 部分:由 NVIDIA RTX 支持的實時光線追蹤電影級場景 我們最近關注了 Gabriele Leone,他是 NVIDIA 的高級設計總監,

Source

]]>
8539
借助 NVIDIA cuQuantum 23.10 加速量子電路模擬 http://www.open-lab.net/zh-cn/blog/accelerate-quantum-circuit-simulation-with-nvidia-cuquantum-23-10/ Mon, 18 Dec 2023 05:09:08 +0000 http://www.open-lab.net/zh-cn/blog/?p=8565 Continued]]> NVIDIA cuQuantum 是一個用于加速量子計算工作流程的優化庫和工具集 SDK。借助 NVIDIA Tensor Core GPU,開發者可以利用它將基于狀態向量和張量網絡方法的量子電路模擬加速數個數量級。 cuQuantum 的目標是在 NVIDIA GPU 和 CPU 上以光速提供量子電路模擬。量子計算框架的用戶可以利用 cuQuantum 支持的模擬器為其工作負載實現 GPU 加速。 cuQuantum 23.10 對 NVIDIA cuTensorNet 和 NVIDIA cuStateVec 進行了更新。新功能包括對 NVIDIA Grace Hopper 系統的支持。欲了解更多信息,請參閱 cuQuantum 23.10 版本說明。 cuTensorNet 提供高級 API,便于量子模擬器開發者以直觀的方式進行編程,以充分利用其功能。

Source

]]>
8565
借助 NVIDIA TAO 為數萬億臺設備開發和優化視覺 AI 模型 http://www.open-lab.net/zh-cn/blog/develop-and-optimize-vision-ai-models-for-trillions-of-devices-with-nvidia-tao/ Wed, 06 Dec 2023 05:18:42 +0000 http://www.open-lab.net/zh-cn/blog/?p=8409 Continued]]> 全球的開發者正在利用 NVIDIA TAO 工具套件 構建 AI 驅動的視覺感知和計算機視覺應用程序。現在,得益于該平臺的顯著增強和強大的生態系統支持,這一過程變得比以往更快、更簡單。 NVIDIA TAO 工具套件 支持超過 10 種計算機視覺和視覺 AI 模型,包括圖像分類、物體檢測、三種類型的分割、光學字符識別 (OCR)、動作識別、關鍵點估計、身體姿態估計、嵌入模型、連體網絡等。 TAO 工具套件的入門速度比以往更快,支持超過 NVIDIA NGC 上的 40 個預訓練模型。利用 TAO 的方法可以隨著用于調整各行各業模型的工作流而不斷擴展。如需了解詳情,請參閱 借助 NVIDIA TAO 和視覺 AI 模型變革工業缺陷檢測 和 自定義 AI 模型:使用 NVIDIA TAO 訓練角色檢測和識別模型。 TAO 的下載量已超過 10 萬次,

Source

]]>
8409
人人超碰97caoporen国产