Technical Walkthrough – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 20 Apr 2023 03:45:59 +0000
zh-CN
hourly
1
196178272 -
使用 ROS 2 MoveIt 和 NVIDIA Isaac Sim 創建逼真的機器人模擬
http://www.open-lab.net/zh-cn/blog/create-realistic-robotics-simulations-with-ros-2-moveit-and-nvidia-isaac-sim/
Tue, 18 Apr 2023 03:16:49 +0000
http://www.open-lab.net/zh-cn/blog/?p=6723
Continued]]>
MoveIt是一個機器人操縱平臺,融合了運動規劃、操縱、 3D 感知、運動學、控制和導航方面的最新進展。PickNik Robotics,領導 MoveIt 開發的公司,正在探索使用NVIDIA Isaac Sim在內部研發項目中。該項目的目標是提高對操縱的感知,并通過MoveIt Studio, PickNik 的商業機器人開發平臺,具有更自主的行為 這篇文章向您展示了如何將 MoveIt 2 與 NVIDIA ISAAC Sim 中模擬的機器人集成。本教程需要一臺安裝了 ISAAC Sim 2022.2.0 的機器,以及如下所列的系統配置。請參閱 NVIDIAIsaac Sim documentation了解具體的安裝細節和要求 要執行 MoveIt 計算的軌跡,我建議使用ros2_control用于管理和與您的機器人通信的框架,無論是真實的還是模擬的。建議使用這種方法,
Source
]]>
6723
-
使用 NVIDIA Isaac ROS 開發人員預覽版 3 構建高性能機器人應用程序
http://www.open-lab.net/zh-cn/blog/build-high-performance-robotic-applications-with-nvidia-isaac-ros-developer-preview-3/
Tue, 18 Apr 2023 03:11:56 +0000
http://www.open-lab.net/zh-cn/blog/?p=6719
Continued]]>
機器人的復雜性正在增加,具有更高的自主性、更多的傳感器數量和多樣性,以及更多基于傳感器融合的算法。硬件加速對于運行這些日益復雜的工作負載至關重要,從而使機器人應用程序能夠以更高的速度和能效運行更大的工作負載。 NVIDIA Isaac ROS的使命一直致力于為 ROS 開發人員提供開發高性能、節能機器人應用所需的加速計算包和工具 NVIDIA 還在 ROS2 中開創了加速計算的先河,并在每個版本中不斷改進。在過去的兩年里,已經添加了 20 多個硬件加速 ROS 包,并支持最新的 ROS 2 分發。 該團隊去年與 Open Robotics 合作,包括自適應和類型協商,以提高提供硬件加速器的計算平臺上的 ROS 性能。他們還實施了 ISAAC ROS 的適應和類型協商,稱為 NITROS (NVIDIA Isaac Transport for ROS).
Source
]]>
6719
-
NVIDIA DGX 云與 Oracle 云基礎架構上的高性能存儲
http://www.open-lab.net/zh-cn/blog/high-performance-storage-on-nvidia-dgx-cloud-with-oracle-cloud-infrastructure/
Tue, 18 Apr 2023 03:07:24 +0000
http://www.open-lab.net/zh-cn/blog/?p=6715
Continued]]>
加速計算的驚人進步是由數據推動的。對于希望在當前快節奏的數字環境中保持領先的企業來說,數據在加速人工智能工作負載方面的作用至關重要。加速對這些數據的訪問是 NVIDIA 加速整個人工智能工作流程的另一種方式 NVIDIA DGX Cloud滿足各種各樣的市場用例。 NVIDIA 在利用我們的基礎設施合作伙伴提供的獨特功能的軟件集成方面投入了大量資金。 Oracle Cloud Infrastructure ( OCI )是 NVIDIA 的領先合作伙伴,致力于實現對實現 DGX Cloud 至關重要的計算、網絡和存儲基礎設施 為了在 OCI 上為 NVIDIA DGX Cloud 實現高性能存儲, NVIDIA 將 Oracle 的裸機基礎設施與 NVIDIA NVMesh 軟件配對。這使得文件存儲能夠根據需要進行擴展,以便在 DGX Cloud 上使用。
Source
]]>
6715
-
GROMACS 2023 中的 CUDA 圖指南
http://www.open-lab.net/zh-cn/blog/a-guide-to-cuda-graphs-in-gromacs-2023/
Fri, 14 Apr 2023 03:39:26 +0000
http://www.open-lab.net/zh-cn/blog/?p=6734
Continued]]>
GPU 隨著新一代的出現而不斷加快,通常情況下 GPU 上的每個活動(如內核或內存拷貝)都會很快完成。在過去,每個活動都必須由 CPU 單獨安排(啟動),相關的開銷可能會累積起來,成為性能瓶頸。 CUDA Graphs功能通過將多個 GPU 活動安排為單個計算圖來解決這個問題。 這篇文章描述了 CUDA Graphs 最近是如何被GROMACS,是一個用于生物分子系統的模擬包,也是世界上使用率最高的科學軟件應用程序之一。我們將介紹 CUDA Graphs 和 GROMACS ,描述我們將 CUDA Graphs 集成到 GROMACS (以及與 GROMACS 共同設計)中的工作,展示性能結果,并向您展示如何在 GROMACS 中使用 CUDA Graphs 經過 NVIDIA 和core GROMACS developers,以充分利用現代 GPU 加速服務器。有關更多詳細信息,
Source
]]>
6734
-
利用三維合成數據進行自舉目標檢測模型訓練
http://www.open-lab.net/zh-cn/blog/bootstrapping-object-detection-model-training-with-3d-synthetic-data/
Wed, 29 Mar 2023 06:27:19 +0000
http://www.open-lab.net/zh-cn/blog/?p=6615
Continued]]>
訓練人工智能模型需要大量的數據。獲取大量訓練數據可能很困難、耗時且成本高昂。此外,所收集的數據可能無法涵蓋各種角落的情況,從而使人工智能模型無法準確預測各種場景。 Synthetic data提供了一種替代真實世界數據的方法,使人工智能研究人員和工程師能夠引導人工智能模型訓練。除了引導模型訓練外,研究人員還可以通過改變許多不同的參數(如位置、顏色、對象大小或照明條件)來快速生成新的數據集,以生成有助于創建通用模型的不同數據 這篇文章向你展示了如何使用一個模型,使用從NVIDIA Omniverse Replicator,一個以編程方式生成物理上精確的 3D 合成數據的 SDKpretrained model使用這些數據,而不是收集真實世界的數據。使用合成數據,可以創建所需的確切場景,甚至可以添加新元素或調整場景,從而進一步迭代對象檢測管道 要生成合成數據,
Source
]]>
6615
-
使用 NVIDIA Nsight 系統加速數據中心和 HPC 性能分析
http://www.open-lab.net/zh-cn/blog/accelerating-data-center-and-hpc-performance-analysis-with-nvidia-nsight-systems/
Tue, 28 Mar 2023 06:33:07 +0000
http://www.open-lab.net/zh-cn/blog/?p=6618
Continued]]>
當 GPU 啟動線程、調度內核和從內存加載時, CPU 異步地向其提供數據、訪問網絡通信、管理系統資源等等。這只是運行應用程序所需的硬件活動的一小部分——由不同組件組成的管弦樂隊以完美的并行方式運行。作為一名開發人員,你是一個硬件管弦樂隊的指揮,旨在為最高性能進行協調。 NVIDIA Nsight 系統是一個系統范圍的評測工具,可以幫助調整您的硬件管弦樂隊。它使應用程序開發人員能夠調查相關性、依賴性、瓶頸和資源分配,以確保硬件組件協調工作。它在統一的時間線上可視化吞吐量和性能指標,自動檢測性能限制因素,并建議如何解決這些問題 對于根除單機效率低下的問題, Nsight 系統跟蹤是一種有效的方法。但這種工作流程是如何擴展的呢?多節點環境對現代計算工作負載至關重要。多節點評測是針對這些環境的一種分析技術,用于識別可能影響節點的瓶頸和其他性能問題,以及如何協調這些節點。
Source
]]>
6618
-
AutoDMP 利用 AI 和 GPU 優化芯片設計的宏布局
http://www.open-lab.net/zh-cn/blog/autodmp-optimizes-macro-placement-for-chip-design-with-ai-and-gpus/
Mon, 27 Mar 2023 06:37:27 +0000
http://www.open-lab.net/zh-cn/blog/?p=6621
Continued]]>
大多數現代數字芯片以存儲塊或模擬塊的形式集成大量宏,如時鐘生成器。這些宏通常比標準單元大得多,標準單元是數字設計的基本組成部分 宏布局對芯片的外觀有著巨大的影響,直接影響到許多設計指標,如面積和功耗。因此,改進這些宏指令的位置對于優化每個芯片的性能和效率至關重要。 傳統上,設計者會根據歷史悠久的實踐手動放置宏。例如,它們可能出現在樓層平面輪廓的外圍。然而,手動找到最佳宏位置是非常耗時的。考慮到宏布局、標準單元布局以及由此產生的功率、性能和面積( PPA )之間的現代復雜關系,可以改進該過程 最近在改善宏觀布局方面做出的兩項努力是基于強化學習的宏觀布局和宏和標準單元格的并行放置. RL 方法將宏放置問題公式化為一個博弈。游戲代理的動作對應于宏的可能位置。通過采樣許多放置示例,代理學習優化其策略(通常由神經網絡表示),以提高宏放置質量。
Source
]]>
6621
-
推出 NVIDIA Aerial 研究云,用于 5G 和 6G 領域的創新
http://www.open-lab.net/zh-cn/blog/introducing-aerial-research-cloud-for-innovations-in-5g-and-6g/
Thu, 23 Mar 2023 06:45:30 +0000
http://www.open-lab.net/zh-cn/blog/?p=6627
Continued]]>
NVIDIA 推出了Aerial研究云,這是第一個完全可編程的 5G 和 6G 網絡研究沙盒,使研究人員能夠快速模擬、原型化和基準測試通過Aerial網絡部署的創新新軟件。 該平臺通過全棧 C 可編程 5G 網絡實現 6G 創新的民主化,并使用 NVIDIA 加速計算在高級無線通信中啟動 ML 。 為什么這很重要?目前的平臺需要幾個月的時間來進行原型、開發算法或實驗。這是因為在當前使用 MATLAB 或硬件描述語言的方法中潛在的設計效率低下。創新者必須依賴昂貴的黑匣子基礎設施,而這些基礎設施沒有配備 ML 工具鏈。 如今的研究平臺也沒有提供符合標準的驗證和基準測試能力。如果沒有可編程基站和核心節點網絡元件,開發人員在快速原型設計方面會受到很大阻礙。 Aerial 研究云已經消除了必須使用專有黑匣子和接口的束縛,以及對遺留編程工具的需求。
Source
]]>
6627
-
使用 RAPIDS RAFT 進行機器學習和數據分析的可重用計算模式
http://www.open-lab.net/zh-cn/blog/reusable-computational-patterns-for-machine-learning-and-data-analytics-with-rapids-raft/
Wed, 22 Mar 2023 06:50:35 +0000
http://www.open-lab.net/zh-cn/blog/?p=6533
Continued]]>
在許多數據分析和機器學習算法中,計算瓶頸往往來自控制端到端性能的一小部分步驟。這些步驟的可重用解決方案通常需要低級別的基元,這些基元非常簡單且耗時。 NVIDIA 制造 RAPIDS RAFT 是為了解決這些瓶頸,并在為多維數據構建算法時最大限度地重用,例如機器學習和數據分析中經常遇到的問題。 RAPIDS 是 GPU 上的一套用于數據科學和機器學習的加速庫: 高度優化的 RAFT 計算模式構成了一個豐富的模塊化嵌入式加速器目錄,為您提供了強大的元素來組成新的算法或加速現有的庫。 這僅僅是一個開始:隨著新 GPU 架構的發布, RAFT 組件將繼續優化,確保您始終從硬件中獲得最佳性能。 RAFT 使您能夠花時間設計和開發應用程序,而不必擔心您是否能充分利用 GPU 硬件。 在這篇文章中,我討論了 RAFT 在開發人員工具箱中的位置,使用它的環境,更重要的是,
Source
]]>
6533
-
NVIDIA 認證的人工智能、視頻和數據分析性能的下一代計算平臺
http://www.open-lab.net/zh-cn/blog/nvidia-certified-next-generation-computing-platforms-for-ai-video-and-data-analytics-performance/
Wed, 22 Mar 2023 06:02:34 +0000
http://www.open-lab.net/zh-cn/blog/?p=6517
Continued]]>
GPU – accelerated computing 的業務應用程序將在未來幾年大幅擴展。增長最快的趨勢之一是使用生成人工智能來創建類似人類的文本和所有類型的圖像。 推動市場對生成人工智能興趣激增的是 transformer models 等技術,這些技術將人工智能帶入日常應用,從對話文本到蛋白質結構生成。可視化和 3D 計算也迅速引起人們的興趣,特別是在工業模擬和協作領域。 隨著 Apache Spark 等核心應用程序的加速, GPU 有望成為數據分析、商業智能和機器學習效率和成本節約的重要驅動力。最后,在智能空間和工業自動化擴張的推動下,邊緣的人工智能推理部署是企業增長最快的領域之一。 旨在解決這些日益復雜的計算需求的新一代計算技術正在出現。這包括 NVIDIA 的新 GPU 體系結構,以及 AMD 、 Intel 和 NVIDIA 新 CPU 。
Source
]]>
6517
-
使用 NVIDIA Jetson Orin Nano 開發套件開發人工智能機器人、智能視覺系統等
http://www.open-lab.net/zh-cn/blog/develop-ai-powered-robots-smart-vision-systems-and-more-with-nvidia-jetson-orin-nano-developer-kit/
Tue, 21 Mar 2023 08:47:51 +0000
http://www.open-lab.net/zh-cn/blog/?p=6567
Continued]]>
NVIDIA Jetson Orin Nano Developer Kit 為創建入門級人工智能機器人、智能無人機和智能視覺系統設定了一個新標準,如 NVIDIA announced 和 NVIDIA GTC 2023 。它還簡化了 NVIDIA Jetson Orin Nano 系列的入門。緊湊的設計、眾多的連接器和高達 40 項人工智能性能,使這款開發套件成為將您富有遠見的概念轉化為現實的理想選擇。 該開發套件由一個 Jetson Orin Nano 8GB模塊和一個參考承載板組成,該承載板可容納所有 NVIDIA Jetson Orin Nano-和 NVIDIA ZVK4]Orin NX模塊,為下一代邊緣人工智能產品的原型設計提供了理想的平臺。 Jetson Orin Nano 8 GB 模塊采用 NVIDIA Ampere architecture GPU ,
Source
]]>
6567
-
利用 NVIDIA BioNeMo 服務構建用于藥物發現的生成人工智能管道
http://www.open-lab.net/zh-cn/blog/build-generative-ai-pipelines-for-drug-discovery-with-bionemo-service/
Tue, 21 Mar 2023 07:27:39 +0000
http://www.open-lab.net/zh-cn/blog/?p=6561
Continued]]>
創造新的候選藥物是一項英勇的努力,通常需要 10 多年的時間才能將一種藥物推向市場。理解生物學和化學文本的新的超級計算規模的大型語言模型( LLM )正在幫助科學家理解蛋白質、小分子、 DNA 和生物醫學文本。 這些最先進的人工智能模型有助于生成 de novo 蛋白質和分子,并預測蛋白質的 3D 結構。他們可以預測小分子與蛋白質的結合結構,并為科學家提供更容易的方法來設計新的候選藥物,最終為患者帶來希望。 2021 Exscientia brought an AI-designed drug candidate 進行臨床試驗后,其他幾家公司宣布他們的候選人正在試驗中。在專注于基于人工智能的發現的制藥公司中,有關于 160 discovery programs 的公開信息,據報道其中 15 種產品正在臨床開發中。
Source
]]>
6561
-
使用 NVIDIA TAO Toolkit 5.0 訪問最新的視覺 AI 模型開發工作流
http://www.open-lab.net/zh-cn/blog/access-the-latest-in-vision-ai-model-development-workflows-with-nvidia-tao-toolkit-5-0/
Tue, 21 Mar 2023 07:20:06 +0000
http://www.open-lab.net/zh-cn/blog/?p=6558
Continued]]>
NVIDIA TAO Toolkit 提供了一個低代碼人工智能框架,用于加速視覺人工智能模型開發,適用于從新手到專家數據科學家的所有技能水平。借助 NVIDIA TAO (訓練、適應、優化)工具包,開發人員可以利用遷移學習的力量和效率,通過適應和優化,在創紀錄的時間內實現最先進的精度和生產級吞吐量。 在 NVIDIA GTC 2023 上, NVIDIA 發布了 NVIDIA TAO Toolkit5.0 ,帶來了突破性的功能來增強任何人工智能模型的開發。新功能包括開源架構、基于 transformer 的預訓練模型、人工智能輔助的數據注釋,以及在任何平臺上部署模型的能力。 NVIDIA TAO Toolkit 5.0 支持 ONNX 中的模型導出。這使得在邊緣或云中的任何計算平臺 GPU 、 CPU 、 MCU 、 DLA 、
Source
]]>
6558
-
在 NVIDIA Base 指揮平臺上設計具有靈活工作流的數字孿生
http://www.open-lab.net/zh-cn/blog/designing-digital-twins-with-flexible-workflows-on-nvidia-base-command-platform/
Mon, 20 Mar 2023 08:57:19 +0000
http://www.open-lab.net/zh-cn/blog/?p=6574
Continued]]>
NVIDIA Base Command Platform 提供了自信地開發復雜軟件的能力,這些軟件符合科學計算工作流程所需的性能標準。該平臺為開發人員提供高效配置和管理人工智能工作流程所需的工具,從而為人工智能開發提供云托管和本地解決方案。集成的數據和用戶管理簡化了用戶和管理員的體驗。 現在,使用 NVIDIA PhysicsNeMo 和基本指揮平臺在團隊和地點之間創建高保真數字雙胞胎是 high-performance computing ( HPC )工作流可用的最新工具。對于從預測最優 airplane maintenance schedules 到 simulating wind farms 的許多用例來說,創建和使用數字雙胞胎對于節省時間和金錢至關重要。 開始使用這些用例可能會讓人望而卻步。然而,一個集成良好的解決方案會帶來所有的不同,
Source
]]>
6574
-
借助 NVIDIA AI 和路徑跟蹤技術實現超現實
http://www.open-lab.net/zh-cn/blog/ultra-realism-made-accessible-with-ai-and-path-tracing-technologies/
Mon, 20 Mar 2023 08:51:59 +0000
http://www.open-lab.net/zh-cn/blog/?p=6571
Continued]]>
在 GDC 2023 上, NVIDIA 發布了新工具,使開發人員更容易訪問實時路徑跟蹤,同時加速創建超逼真的游戲世界。 視頻 1 。 NVIDIA 在 GDC 2023 :幀生成和路徑跟蹤工具現已上市 DLSS 3 采用 NVIDIA Ada Lovelace 架構發布,不僅提高了視覺效果,還提高了性能和響應能力。自 2019 年推出 NVIDIA 圖靈架構以來, DLSS 不斷為游戲渲染中的人工智能設定新標準。 幀生成是最新的發展。 DLSS 幀生成是 DLSS 3 中使用 AI 創建全新幀的新性能倍增器。它由 NVIDIA GeForce 40 系列和光流加速器提供動力。這一突破使實時路徑追蹤成為視頻游戲圖形領域的下一個前沿。 自該公告發布以來, 28 款頂級游戲和應用程序現在都使用 DLSS 3 來提供具有難以置信性能的逼真圖形,
Source
]]>
6571
人人超碰97caoporen国产