物理學 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Wed, 25 Jun 2025 05:08:39 +0000
zh-CN
hourly
1
196178272 -
使用 NVIDIA Nsight Profiler 簡化 EDF 流體動力學模擬的 GPU 移植
http://www.open-lab.net/zh-cn/blog/streamlining-gpu-porting-for-edfs-fluid-dynamics-simulations-with-nvidia-nsight-profilers/
Thu, 12 Jun 2025 07:52:36 +0000
http://www.open-lab.net/zh-cn/blog/?p=14254
Continued]]>
將現有 CPU 應用程序移植到 NVIDIA GPU 可以釋放性能提升,使用戶能夠以更大的規模和更快的速度解決問題。雖然修改代碼以實現 NVIDIA GPU 加速需要在初始階段投入時間和精力,但由此帶來的吞吐量和效率提升通常遠遠超過成本。 這樣的任務可能看起來令人生畏,并引起了人們的擔憂,因為他們會浪費時間,最終產生無法提供任何好處的半移植 CPU 代碼到 GPU 代碼。但是,將 CPU 代碼移植到 GPU 代碼可以逐步完成,從而實現即時加速并更大限度地降低風險。 在整個移植過程中,如果不需要先進的內核優化技術,將單個任務從 CPU 移植到 GPU 可提供顯著的加速和下游性能優勢,則經常會出現這種情況。 無論您是初學者還是資深 NVIDIA CUDA 開發者,NVIDIA Nsight 工具套件都支持整個移植流程。只需輕松設置 NVIDIA Nsight Systems,
Source
]]>
14254
-
由 NVIDIA 驅動的現代超級計算機如何推動速度和科學的極限
http://www.open-lab.net/zh-cn/blog/nvidia-top500-supercomputers-isc-2025/
Tue, 10 Jun 2025 05:06:24 +0000
http://www.open-lab.net/zh-cn/blog/?p=14394
Continued]]>
現代高性能計算 (HPC) 實現的不僅僅是快速計算,它還為正在解鎖科學突破的 AI 系統提供支持。 HPC 已經經歷了多次迭代,每次迭代都因技術的創造性再利用而引發。例如,早期的超級計算機使用現成的組件。后來,研究人員利用個人計算機構建了強大的集群,甚至還調整了游戲 graphics cards 以用于科學工作。 當今的 HPC 系統(許多由 NVIDIA 加速計算提供支持)專為速度而設計。今天在 ISC 2025 上公布的最新全球超級計算機 TOP500 榜單強調了這一點,其中 77% 的系統由 NVIDIA 提供支持。 與此同時,Tensor Core 等創新功能可為矩陣乘法等常見運算提供更快的計算速度,并且混合精度 (一種結合多個浮點精度格式的技術,詳情見下文) 等技術的越來越多的使用正在提高性能和能效,從而推動氣候科學和醫學等領域的飛躍。
Source
]]>
14394
-
NVIDIA GB200 NVL72 提供萬億參數 LLM 訓練和實時推理
http://www.open-lab.net/zh-cn/blog/nvidia-gb200-nvl72-delivers-trillion-parameter-llm-training-and-real-time-inference/
Mon, 18 Mar 2024 07:00:33 +0000
http://www.open-lab.net/zh-cn/blog/?p=9393
Continued]]>
對萬億參數模型的興趣是什么?我們知道當今的許多用例,并且由于有望提高以下方面的能力,人們的興趣正在增加: 其優勢是巨大的,但訓練和部署大型模型的計算成本高昂且需要大量資源。旨在提供實時推理的計算高效、經濟高效且節能的系統對于廣泛部署至關重要。新的 NVIDIA GB200 NVL72 就是這樣一個系統,可以完成這項任務。 為了說明這一點,我們考慮一下多專家模型 (MoE).這些模型有助于在多個專家之間分配計算負載,并使用模型并行和管道并行跨數千個 GPU 進行訓練。提高系統效率。 然而,并行計算、高速顯存和高性能通信的新水平可以使 GPU 集群能夠應對棘手的技術挑戰。 NVIDIA GB200 NVL72 機架級架構實現了這一目標,我們將在以下博文中詳細介紹。 核心 GB200 NVL72 是 NVIDIA GB200 Grace Blackwell 超級芯片。
Source
]]>
9393
-
新視頻:用 OpenUSD 自定義模式表示數據
http://www.open-lab.net/zh-cn/blog/new-video-representing-data-with-openusd-custom-schemas/
Wed, 20 Sep 2023 06:47:12 +0000
http://www.open-lab.net/zh-cn/blog/?p=7887
Continued]]>
自定義架構中的 Universal Scene Description,也被稱為 OpenUSD 或 USD,對于尋求表示和編碼復雜虛擬世界的開發人員來說至關重要。通過對數據模型進行形式化,模式使得符合 USD 的運行時能夠解釋原始數據。 無論是支持物理模擬,還是擴展 數字孿生,自定義模式都為虛擬環境中的創造力、保真度和創新提供了基礎。 在本期的第三期 OpenUSD 系列,我分享了開發人員必須了解的關于自定義模式的知識。 具體而言,我們深入探討: USD 中的自定義模式為制作更復雜的虛擬世界開辟了許多途徑。Open USD 包括幾何和著色等核心模式,并不斷開發自定義模式以拓寬數字景觀。 請訪問我們的 OpenUSD 資源頁面 以獲取最新的 USD 資源和教程。試試免費的 RunUSD 驗證服務,驗證您的 OpenUSD 資產和應用程序與一系列 Open…
Source
]]>
7887
-
更好的 3D 網格,從重建到生成 AI
http://www.open-lab.net/zh-cn/blog/better-3d-meshes-from-reconstruction-to-generative-ai/
Fri, 11 Aug 2023 05:00:35 +0000
http://www.open-lab.net/zh-cn/blog/?p=7602
Continued]]>
下一代人工智能管道在生成高保真 3D 模型方面取得了令人難以置信的成功,從生成與給定圖像匹配的場景的重建,到生成交互式體驗資產的生成人工智能管道。 這些生成的三維模型通常被提取為標準三角形網格。網格表示提供了許多好處,包括支持現有軟件包、高級硬件加速和支持物理模擬。然而,并非所有網格都是相等的,這些好處只有在高質量的網格上才能實現。 NVIDIA 最近的研究發現了一種名為 FlexiCubes 的新方法,用于在 3D 管道中生成高質量網格,從而在一系列應用中提高質量。 從重建到模擬,人工智能管道的共同組成部分是通過優化過程生成網格。在過程的每一步,表示都會更新,以更好地匹配所需的輸出。 FlexiCubes 網格生成的新思想是引入額外的、靈活的參數來精確調整生成的網格。通過在優化過程中更新這些參數,大大提高了網格質量。
Source
]]>
7602
人人超碰97caoporen国产