CFD/CAE – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 28 Feb 2025 08:54:35 +0000 zh-CN hourly 1 196178272 NVIDIA cuDSS 提高工程和科學計算中的求解器技術 http://www.open-lab.net/zh-cn/blog/nvidia-cudss-advances-solver-technologies-for-engineering-and-scientific-computing/ Tue, 25 Feb 2025 08:54:08 +0000 http://www.open-lab.net/zh-cn/blog/?p=13042 Continued]]> NVIDIA cuDSS 是第一代稀疏直接求解器庫,旨在加速工程和科學計算。cuDSS 正越來越多地應用于數據中心和其他環境,并支持單 GPU、多 GPU 和多節點(MGMN)配置。 cuDSS 已成為加速多個領域 (例如結構工程、流體動力學、電磁學、電路模擬、優化和 AI 輔助工程問題) 的計算機輔助工程 (CAE) 工作流程和科學計算的關鍵工具。 本文重點介紹了 cuDSS v0.4.0 和 cuDSS v0.5.0 中提供的一些關鍵性能和可用性功能 (如表 1 中總結的內容),cuDSS v0.4.0 可顯著提升分解和求解步驟的性能,同時還引入了一些新功能,包括內存預測 API、自動混合內存選擇和可變批量支持。cuDSS v0.5.0 增加了主機執行模式,這對較小的矩陣特別有利,并且在分析階段使用混合內存模式和主機多線程實現了顯著的性能提升,

Source

]]>
13042
Warp 1.5.0 引入圖塊化編程 http://www.open-lab.net/zh-cn/blog/introducing-tile-based-programming-in-warp-1-5-0/ Sat, 14 Dec 2024 05:55:43 +0000 http://www.open-lab.net/zh-cn/blog/?p=12531 Continued]]> 借助最新版本的 Warp 1.5.0 ,開發者現在可以使用 Python 中基于圖塊的新編程基元。這些新工具利用 cuBLASDx 和 cuFFTDx ,在 Python 內核中為開發者提供高效的矩陣乘法和 Fourier 變換,從而加速仿真和科學計算。在這篇博文中,我們將介紹這些新功能,并展示如何使用它們來優化應用。Warp 1.5.0 中提供的基于圖塊的編程模型目前處于預覽階段,在即將推出的版本中,性能和 APIs 可能會發生變化。 在過去十年中,GPU 硬件已從單純的 SIMT (單指令多線程) 執行模型發展為高度依賴協作操作來提高效率的模型。隨著 Tensor Core 數學單元在整體 GPU 計算中的作用越來越大,高效且高效的編程變得越來越重要。高級 API 如 BLAS 提供的抽象概念可以面向各種高性能低級指令。但是,這些 API 通常難以與用戶程序集成,

Source

]]>
12531
利用 AI 支持的虛擬風洞進行流體流動學習 http://www.open-lab.net/zh-cn/blog/learning-fluid-flow-with-ai-enabled-virtual-wind-tunnels/ Mon, 14 Oct 2024 04:53:47 +0000 http://www.open-lab.net/zh-cn/blog/?p=11747 Continued]]> 即使在工程教育方面,也沒有足夠的時間做所有事情。雇主希望工程師能夠使用模擬工具來加速迭代研究、設計和開發。一些講師試圖通過教授數周或數月的課程來解決這一問題,課程內容包括數值方法的推導、離散化方法、湍流模型的復雜性等。 遺憾的是,專注于基礎知識幾乎沒有時間或根本沒有時間幫助培養更高級別的技能和直覺,而這正是雇主想要和需要的 其他人則試圖通過一種應用方法來解決這一問題。在學生學習軟件教程和更復雜的項目時指導和指導他們,這看起來似乎是一種解決方案。 這是一個陷阱。我們要求學生深入研究具有復雜界面和無限設置的軟件包,這些軟件包是為適應任何和所有特殊用例而設計和開發的,而不是學習基礎知識。這使學生能夠在一定程度上熟悉模擬項目和軟件,但犧牲了對數值方法基礎知識的理解。這種方法也無法提供雇主所尋求的技能。 下面簡要概述了我開發的方法:面向工程專業學生的更直觀、

Source

]]>
11747
利用 NVIDIA PhysicsNeMo 實現 CFD 模擬的機器學習轉換 http://www.open-lab.net/zh-cn/blog/transforming-cfd-simulations-with-ml-using-nvidia-modulus/ Fri, 11 Oct 2024 05:00:41 +0000 http://www.open-lab.net/zh-cn/blog/?p=11752 Continued]]> 模擬在推動科學和工程發展方面發揮著至關重要的作用,尤其是在流體動力學的廣闊領域。然而,高保真流體模擬需要大量的計算資源,通常會限制實際應用。準確模擬復雜流動可能需要數周的計算工作,從而拖慢航空航天和環境工程等關鍵領域的進展。 機器學習 (ML) 通過應對這些挑戰,正在徹底改變計算流體動力學 (CFD)。ML 算法使研究人員能夠使用大規模數據集,并創建模型,以模擬復雜流問題的真實行為,同時顯著降低計算成本。 流體動力學領域一種前景廣闊的機器學習方法涉及 Fourier 神經運算符 (FNO),該運算符可以學習分辨率不變的解運算符。FNO 為在低分辨率數據上訓練復雜流模型開辟了可能性,這些數據可以動態集成到高保真數值模擬中,從而降低了許多應用的計算成本。 NVIDIA PhysicsNeMo 通過其開源框架提供了一種利用 FNO 這些優勢的簡便方法,該框架專為構建、

Source

]]>
11752
聚焦:Shell 使用 NVIDIA PhysicsNeMo 將 CO2 存儲建模速度提高 100000 倍 http://www.open-lab.net/zh-cn/blog/spotlight-shell-accelerates-co2-storage-modeling-100000x-using-nvidia-modulus/ Mon, 09 Sep 2024 08:50:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=11302 Continued]]> 隨著世界在應對氣候變化方面的迫切需求,碳捕獲和存儲(CCS)已成為實現凈零排放的關鍵技術。CCS 技術包括從工業排放或通過直接空氣捕獲(DAC)捕獲二氧化碳(CO2),并將其安全地存儲在地下,可以推動需的脫碳策略,并幫助實現全球氣候目標。 CCS 技術的成功取決于對存儲點和注入方案的仔細選擇。準確預測長期(通常跨越數百年)的 CO2 plume 遷移和壓力累積對于確保存儲點的安全性和有效性至關重要。找到最佳設置需要在不同的地下條件、井位和注入速率下評估數萬種配置。但是,通常用于這些預測的傳統流量模擬器需要大量計算,因此限制了對潛在地點和注入方案的高吞吐量篩選。 為應對這些挑戰,Shell 正與 NVIDIA 合作,通過 NVIDIA PhysicsNeMo 利用尖端技術來提高 CCS 站點篩選流程的效率和準確性。 該項目利用機器學習(ML)模型實現了地下 CO2…

Source

]]>
11302
借助 NVIDIA GPU 從 Luminary Cloud 的工程模擬中更快地獲得見解 http://www.open-lab.net/zh-cn/blog/faster-insights-from-luminary-clouds-engineering-simulations-with-nvidia-gpus/ Fri, 26 Jul 2024 08:17:32 +0000 http://www.open-lab.net/zh-cn/blog/?p=10838 Continued]]> 工程模擬跨行業應用,以加速產品開發。模擬用于檢查飛機、汽車和建筑物的安全性,確保您的手機隨時隨地都有信號,并最大限度地擴大新款電動汽車的行駛范圍。它減少了對昂貴且耗時的物理測試的需求,并使工程師能夠更快地迭代改進設計。 遺憾的是,運行復雜的模擬也需要大量的高性能計算(HPC)資源,并且會耗費大量時間。 Luminary Cloud, 一 NVIDIA Inception 程序面向初創公司的成員,從一開始就利用最新的云和 NVIDIA GPU 技術進行開發,從而消除組織的計算負擔并加速這些模擬。 在本文中,我將討論在各行各業中更廣泛地采用模擬所面臨的挑戰,以及 Luminary Cloud 如何使用最新的云和 NVIDIA GPU 加速計算來應對這些挑戰。我還將討論與Joby Aviation的真實案例研究。 在計算流體動力學(CFD)領域,

Source

]]>
10838
人人超碰97caoporen国产