101 / Getting Started – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 22 Sep 2023 06:11:24 +0000 zh-CN hourly 1 196178272 使用 NVIDIA Holoscan for Media 進行軟件定義廣播 http://www.open-lab.net/zh-cn/blog/software-defined-broadcast-with-nvidia-holoscan-for-media/ Thu, 14 Sep 2023 05:55:10 +0000 http://www.open-lab.net/zh-cn/blog/?p=7896 Continued]]> 廣播行業正在經歷內容創建、管理、分發和消費方式的轉變。這一轉變包括從受固定功能設備約束的傳統線性工作流程轉變為靈活和混合的軟件定義系統,從而實現直播的未來。 開發人員現在可以申請加入 NVIDIA Holoscan for Media,這是一個軟件定義的平臺,用于在本地、云端和邊緣開發和部署媒體應用程序。 使用 Holoscan for Media,廣播公司和解決方案提供商可以利用最新的 IT 和資源調配技術,以及現代的基于容器的開發、編排和交付方法。 Holoscan for Media 是一個基于 IP 的解決方案,基于行業標準和 API,包括 SMPTE ST 2110、AMWA NMOS、RIST、SRT 和 NDI。 該平臺集成了開源和無處不在的技術,打破了基于 SDI 和 FPGA 的系統的專有性和靈活性。它還可以將最新的功能,例如 生成性 AI,

Source

]]>
7896
使用 NVIDIA Triton 管理服務擴展深度學習部署 http://www.open-lab.net/zh-cn/blog/scaling-deep-learning-deployments-with-nvidia-triton-management-service/ Tue, 12 Sep 2023 09:47:22 +0000 http://www.open-lab.net/zh-cn/blog/?p=7858 Continued]]> 組織正在以前所未有的速度將機器學習(ML)集成到整個系統和產品中。他們正在尋找解決方案,以幫助處理在生產規模部署模型的復雜性。 NVIDIA Triton Management Service (TMS) 是 NVIDIA AI Enterprise 獨家提供的一款新產品,有助于實現這一目標。具體來說,它有助于管理和協調一支由 NVIDIA Triton Inference Servers 在 Kubernetes 集群中運行的團隊。TMS 使用戶能夠擴展其 NVIDIA Triton 部署,以高效地處理各種各樣的工作負載。它還改善了開發人員協調所需資源和工具的體驗。 本文探討了開發人員和 MLOps 團隊在大規模部署模型時面臨的一些最常見的挑戰,以及 NVIDIA Triton 管理服務如何解決這些挑戰。 任何規模的模型部署都會帶來一系列挑戰。

Source

]]>
7858
使用下一代 NVIDIA DLSS 生成突破性的光線追蹤圖像 http://www.open-lab.net/zh-cn/blog/generate-groundbreaking-ray-traced-images-with-next-generation-nvidia-dlss/ Fri, 25 Aug 2023 05:44:26 +0000 http://www.open-lab.net/zh-cn/blog/?p=7718 Continued]]> 自 2018 年以來,NVIDIA DLSS 利用人工智能使游戲玩家和創作者能夠提高性能和質量。隨著時間的推移,這種解決方案已經發展到包括超分辨率和幀生成方面的突破性進展。 現在,人工智能神經渲染技術邁出了下一步,推出了 DLSS 3.5。此更新包括一個名為“光線重建”的重要新功能。 射線重建是一種新的神經網絡,適用于所有 GeForce RTX GPU,這進一步提高了射線追蹤圖像的圖像質量。DLSS 3.5 的數據訓練量是 DLSS 3 的 5 倍,它用 NVIDIA 超級計算機訓練的 AI 網絡取代了手動調諧的去噪器,該網絡能在采樣光線之間生成更高質量的像素。 《賽博朋克 2077》,《賽博朋克 2077:自由幻影》,艾倫·威克 2和帶有 RTX 的門戶,都將在今年秋天推出,將包括 Ray Reconstruction。 DLSS 3.5…

Source

]]>
7718
利用 NVIDIA DOCA Flow 的 DPU 加速數據包引導邏輯 http://www.open-lab.net/zh-cn/blog/harness-dpu-accelerated-packet-steering-logic-with-nvidia-doca-flow/ Wed, 23 Aug 2023 04:58:55 +0000 http://www.open-lab.net/zh-cn/blog/?p=7669 Continued]]> NVIDIA DOCA 是一個框架,旨在簡化 NVIDIA BlueField DPUs 和 ConnectX SmartNICs 的編程和應用程序開發。它通過 SDK、運行時二進制文件和高級 API 提供與網絡應用程序相關的高級抽象構建塊,使開發人員能夠快速創建應用程序和服務。 NVIDIA DOCA Flow 是 DOCA 框架中最新更新的一組軟件驅動程序和一個引導庫。它在用戶空間中運行,并能夠從 CPU 卸載與網絡相關的操作。這反過來又使應用程序能夠以低延遲處理高數據包吞吐量的工作負載,從而節省 CPU 資源并降低功耗。 DOCA Flow 還有效地優化了 BlueField DPU 和 ConnectX SmartNIC 的利用率。 DOCA 是釋放 BlueField 加速引擎潛力的關鍵,而 DOCA Flow 允許快速訪問加速引擎以實現數據包導向邏輯。

Source

]]>
7669
NVIDIA Holoscan 0.6 中具有多 GPU 和多節點功能的可擴展 AI 傳感器流 http://www.open-lab.net/zh-cn/blog/scalable-ai-sensor-streaming-with-multi-gpu-and-multi-node-capabilities-in-holoscan-0-6/ Fri, 18 Aug 2023 06:05:01 +0000 http://www.open-lab.net/zh-cn/blog/?p=7681 Continued]]> 各個行業對實時見解和自主決策的需求正在增長。為了滿足這一需求,我們需要可擴展的邊緣解決方案平臺,這些平臺可以從源頭有效處理人工智能傳感器數據,并擴展到本地或云計算資源。 然而,開發人員在邊緣使用人工智能和傳感器處理時面臨許多挑戰: 在 NVIDIA Holoscan 出現之前,沒有一個單一的平臺能夠提供全面的解決方案來有效應對眾多邊緣人工智能挑戰。Holoscan 通過無縫集成數據移動、加速計算、實時可視化和人工智能推理,確保了最佳的應用程序性能。它為開發人員抽象了復雜性,縮短了上市時間,并提供了用 Python 和 C++ 進行編碼的便利,所有這些都在一個低代碼、高性能的基礎設施中。 Cosmo Intelligent medical Devices 總裁 Nhan Ngo Dinh 表示:“Holoscan 平臺使新的 SaMD(作為醫療設備的軟件)能夠快速生產,

Source

]]>
7681
更好的 3D 網格,從重建到生成 AI http://www.open-lab.net/zh-cn/blog/better-3d-meshes-from-reconstruction-to-generative-ai/ Fri, 11 Aug 2023 05:00:35 +0000 http://www.open-lab.net/zh-cn/blog/?p=7602 Continued]]> 下一代人工智能管道在生成高保真 3D 模型方面取得了令人難以置信的成功,從生成與給定圖像匹配的場景的重建,到生成交互式體驗資產的生成人工智能管道。 這些生成的三維模型通常被提取為標準三角形網格。網格表示提供了許多好處,包括支持現有軟件包、高級硬件加速和支持物理模擬。然而,并非所有網格都是相等的,這些好處只有在高質量的網格上才能實現。 NVIDIA 最近的研究發現了一種名為 FlexiCubes 的新方法,用于在 3D 管道中生成高質量網格,從而在一系列應用中提高質量。 從重建到模擬,人工智能管道的共同組成部分是通過優化過程生成網格。在過程的每一步,表示都會更新,以更好地匹配所需的輸出。 FlexiCubes 網格生成的新思想是引入額外的、靈活的參數來精確調整生成的網格。通過在優化過程中更新這些參數,大大提高了網格質量。

Source

]]>
7602
使用 NVIDIA CloudXR 套件擴展 XR 工作流 http://www.open-lab.net/zh-cn/blog/scale-xr-workflows-with-nvidia-cloudxr-suite/ Wed, 09 Aug 2023 03:34:35 +0000 http://www.open-lab.net/zh-cn/blog/?p=7629 Continued]]> NVIDIA為開發者提供了一個先進的平臺,開發者可以在該平臺上使用全新NVIDIA CloudXR 套件來創建可擴展、品牌化的定制擴展現實(XR)產品。 NVIDIA CloudXR 套件基于全新架構而打造,是擴展XR生態的重要工具。它為開發者、專業人士和企業團隊提供了一個可以跨操作系統靈活編排并擴展XR工作負載的平臺,包括Windows中的虛擬機和基于Linux的系統(比如容器)。 借助NVIDIA CloudXR流式傳輸堆棧,用戶可以構建靈活、高性能的云解決方案,以傳輸要求最嚴苛的沉浸式體驗。團隊還可以使用NVIDIA流式傳輸技術有效管理包括互聯網在內的大型公共和專用網絡上的流式傳輸質量。 圖1. NVIDIA CloudXR 套件由CloudXR Essentials、CloudXR Server Extensions 和 CloudXR…

Source

]]>
7629
策展萬億代幣數據集: NVIDIA NeMo 數據策展人介紹 http://www.open-lab.net/zh-cn/blog/curating-trillion-token-datasets-introducing-nemo-data-curator/ Tue, 08 Aug 2023 04:53:20 +0000 http://www.open-lab.net/zh-cn/blog/?p=7543 Continued]]> 這個大型語言模型 (LLM) 縮放規律的最新發展已經表明,當模型參數的數量進行縮放時,用于訓練的令牌的數量也應該以相同的速率進行縮放。這個Chinchilla和LLaMA模型已經驗證了這些經驗推導的定律,并表明先前最先進的模型在預訓練期間使用的令牌總數方面訓練不足。 考慮到最近的發展, LLM 顯然比以往任何時候都更需要更大的數據集。 然而,盡管有這種需求,大多數為創建用于訓練 LLM 的大規模數據集而開發的軟件和工具都沒有公開發布或可擴展。這需要 LLM 開發人員構建自己的工具來策劃大型語言數據集。 為了滿足對大型數據集日益增長的需求,我們開發并發布了 NeMo 數據策展器:一種可擴展的數據策展工具,使您能夠策展萬億個代幣多語言數據集,用于 LLM 的預訓練。 Data Curator 是一組 Python 模塊,它使用 Message-Passing Interface…

Source

]]>
7543
借助 NVIDIA NeMo 解鎖企業級 LLM 的力量 http://www.open-lab.net/zh-cn/blog/unlocking-the-power-of-enterprise-ready-llms-with-nemo/ Tue, 08 Aug 2023 04:40:21 +0000 http://www.open-lab.net/zh-cn/blog/?p=7539 Continued]]> 生成式人工智能開啟了一個新的計算時代,這個時代有望徹底改變人機交互。這一技術的前沿是大語言模型 (LLMs),它使企業能夠使用大型數據集進行識別、匯總、翻譯、預測和生成內容。然而,生成式人工智能對企業的潛力也伴隨著相當多的挑戰。 由通用 LLM 提供的云服務提供了一種快速入門生成人工智能技術的方法。然而,這些服務通常專注于一系列廣泛的任務,而不是針對特定領域的數據進行培訓,這限制了它們對某些企業應用程序的價值。這導致許多組織構建自己的解決方案——這是一項艱巨的任務——因為他們必須將各種開源工具拼湊在一起,確保兼容性,并提供自己的支持。 NVIDIA NeMo 提供了一個端到端平臺,旨在簡化企業 LLM 的開發和部署,開創人工智能能力的變革時代。NeMo 為您提供創建企業級、可生產的定制 LLM 的基本工具。NeMo 工具套件簡化了數據管理、培訓和部署過程,

Source

]]>
7539
通過 NVIDIA OptiX 8 實現靈活且強大的光線追蹤功能 http://www.open-lab.net/zh-cn/blog/flexible-and-powerful-ray-tracing-with-optix-8/ Mon, 07 Aug 2023 03:50:05 +0000 http://www.open-lab.net/zh-cn/blog/?p=7637 Continued]]> 實現逼真的視覺效果一直是計算機圖形領域人士所追求的目標。NVIDIA OptiX 是一款強大且靈活的光線追蹤技術框架,能讓用戶充分挖掘光線追蹤的潛力。NVIDIA OptiX 是一款基于CUDA并行編程模型的GPU加速光線追蹤API,能夠提供實現光線追蹤所需的全部工具,助力在NVIDIA圖形處理器上高效地定義和執行復雜的光線追蹤算法。配合OpenGL或DirectX等圖形API,NVIDIA OptiX可幫助用戶創建渲染器,實現更快、更具成本效益的產品開發周期。 NVIDIA OptiX 廣泛應用于如產品設計、可視化等各種媒體和娛樂垂直領域。設計人員可通過它渲染出高質量的產品圖像和動畫,提升可視化設計與迭代效率。它可以準確模擬出真實的照明和材質,呈現更加逼真的最終產品。 圖 1. 人物建模圖像:在Maya和Mudbox中建模和貼圖,未使用掃描,

Source

]]>
7637
利用 OpenUSD 和綜合數據開發智慧城市交通管理系統 http://www.open-lab.net/zh-cn/blog/developing-smart-city-traffic-management-systems-with-openusd-and-synthetic-data/ Tue, 01 Aug 2023 02:50:01 +0000 http://www.open-lab.net/zh-cn/blog/?p=7490 Continued]]> 智能城市代表了城市生活的未來。然而,它們可能會給城市規劃者帶來各種挑戰,尤其是在交通領域。為了取得成功,城市的各個方面——從環境和基礎設施到商業和教育——必須在功能上進行整合。 這可能很困難,因為單獨管理交通流量是一個復雜的問題,充滿了擁堵、事故應急響應和排放等挑戰。 為了應對這些挑戰,開發人員正在開發具有現場可編程性和靈活性的人工智能軟件。這些軟件定義的物聯網解決方案可以應用于實時環境,如交通管理,車牌識別,智能停車和事故檢測等。 盡管如此,建立有效的人工智能模型說起來容易做起來難。遺漏值、重復示例、錯誤標簽和錯誤特征值是訓練數據的常見問題,這些問題可能導致模型不準確。在自動駕駛汽車的情況下,不準確的結果可能是危險的,也可能導致交通系統效率低下或城市規劃不佳。 端到端人工智能工程公司 SmartCow,作為 NVIDIA Metropolis 的合作伙伴,

Source

]]>
7490
利用 OpenUSD 和合成數據開發托盤檢測模 http://www.open-lab.net/zh-cn/blog/developing-a-pallet-detection-model-using-openusd-and-synthetic-data/ Tue, 18 Jul 2023 05:41:51 +0000 http://www.open-lab.net/zh-cn/blog/?p=7434 Continued]]> 想象一下,你是一名機器人或機器學習( ML )工程師,負責開發一個檢測托盤的模型,以便叉車能夠操縱托盤。‌您熟悉傳統的深度學習管道,策劃了手動注釋的數據集,并培訓了成功的模型。 你已經為下一個挑戰做好了準備,它以密集堆放的托盤的形式出現。你可能會想,我應該從哪里開始?‌ 2D 邊界框檢測或實例分割對此任務最有用嗎?‌我應該進行三維邊界框檢測嗎?如果是,我將如何對其進行注釋?‌最好使用單眼相機、立體相機或激光雷達進行檢測嗎?‌考慮到自然倉庫場景中出現的托盤數量之多,手動注釋并非易事。如果我弄錯了,代價可能會很高。 這就是我在面對類似情況時所想的。幸運的是,我有一個簡單的方法來開始相對較低的承諾:合成數據。 合成數據生成(SDG)是一種使用渲染圖像而不是真實世界圖像來訓練神經網絡的技術。使用合成渲染數據的優勢在于,您可以隱式地獲取場景中對象的完整形狀和位置,

Source

]]>
7434
新的 MLPerf 推理網絡部門展示 NVIDIA InfiniBand 和 GPUDirect RDMA 功能 http://www.open-lab.net/zh-cn/blog/new-mlperf-inference-network-division-showcases-infiniband-and-gpudirect-rdma-capabilities/ Thu, 06 Jul 2023 04:01:17 +0000 http://www.open-lab.net/zh-cn/blog/?p=7377 Continued]]> 在 MLPerf Inference v3.0 中,NVIDIA 首次向新推出的 網絡分割 投入,現在是 MLPerf 推理數據中心套件的一部分。網絡分割旨在模擬真實的數據中心設置,努力將包括硬件和軟件在內的網絡效果納入端到端推理性能。 網絡部門中有兩種類型的節點:前端節點生成查詢,這些查詢通過標準網絡結構(如以太網或InfiniBand)發送,由加速器節點處理,加速器節點執行推理。 圖 1 顯示了 Closed 分區完全在單個節點上運行。在“網絡”部分中,查詢在“前端”節點上生成,并傳輸到“加速器”節點進行推理。 在網絡部分,加速器節點包含推理加速器以及所有網絡組件。這包括網絡接口控制器( NIC )、網絡交換機和網絡結構。因此,雖然網絡部門試圖衡量加速器節點和網絡的性能,但它排除了前端節點的影響,因為后者在基準測試中的作用有限。

Source

]]>
7377
語音 AI 聚焦:在 AR 眼鏡上可視化口語和聲音 http://www.open-lab.net/zh-cn/blog/speech-ai-spotlight-visualizing-spoken-language-and-sounds-on-ar-glasses/ Fri, 23 Jun 2023 06:28:36 +0000 http://www.open-lab.net/zh-cn/blog/?p=7276 Continued]]> 音頻可以包括各種各樣的聲音,從人類的語音到狗叫聲和警笛聲等非語音。當為聽力困難的人設計可訪問的應用程序時,該應用程序應該能夠識別聲音和理解語音。 這項技術將幫助聾人或重聽人可視化語音,如人類對話和非語音。將語音和聲音 AI 結合在一起,你可以將可視化效果疊加到 AR 眼鏡上,讓用戶可以看到和解釋他們在其他情況下聽不到的聲音。 根據世界衛生組織估計,全球約有 15 億人(占全球人口的近 20%)患有聽力損失。到 2050 年,這一數字可能會上升至 25 億。 Cochl,一家總部位于圣何塞的 NVIDIA 合作伙伴,是一家深度科技初創公司,使用聲音 AI 技術來理解任何類型的音頻。他們也是 NVIDIA 的Inception Program的成員,通過提供尖端技術和 NVIDIA 專家,幫助初創公司更快地構建解決方案。 該平臺可以識別 37 種環境聲音,該公司更進一步,

Source

]]>
7276
聯合學習在傳統機器學習方法中的應用 http://www.open-lab.net/zh-cn/blog/applying-federated-learning-to-traditional-machine-learning-methods/ Thu, 22 Jun 2023 06:35:14 +0000 http://www.open-lab.net/zh-cn/blog/?p=7283 Continued]]> 在大數據和分布式計算時代,傳統的機器學習方法面臨著一個重大挑戰:當數據分散在多個設備或豎井中時,如何協同訓練模型。這就是聯合學習發揮作用的地方,它提供了一個很有前途的解決方案,將模型訓練與直接訪問原始訓練數據脫鉤。 聯合學習最初旨在實現去中心化數據上的協作深度學習,其關鍵優勢之一是其通信效率。這種相同的范式可以應用于傳統的 ML 方法,如線性回歸、 SVM 、 k-means 聚類,以及基于樹的方法,如隨機森林和 boosting 。 開發傳統 ML 方法的聯合學習變體需要在幾個層面上進行仔細考慮: 值得注意的是聯邦的和分布式的與深度學習相比,傳統方法的機器學習可能不那么獨特。對于某些算法和實現,這些術語可以是等效的。 在圖 1 中,每個客戶端構建一個唯一的增強樹,該樹由服務器聚合為樹的集合,然后重新分發給客戶端進行進一步的訓練。

Source

]]>
7283
人人超碰97caoporen国产