開發工具與庫 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 26 Oct 2023 06:33:28 +0000
zh-CN
hourly
1
196178272 -
Differential Slang:應用實例
http://www.open-lab.net/zh-cn/blog/differentiable-slang-example-applications/
Mon, 23 Oct 2023 06:20:55 +0000
http://www.open-lab.net/zh-cn/blog/?p=8056
Continued]]>
Differential Slang 可以輕松地與現有的代碼庫集成,從 Python、PyTorch、CUDA 到 HLSL,以幫助執行多個計算機圖形任務,并實現新的數據驅動和神經研究。在這篇文章中,我們介紹了幾個使用可微分 Slang 的代碼示例,以展示不同渲染應用程序的潛在用途和集成的容易性。 這是關于可區分俚語系列的一部分。要獲取更多關于 Slang 語言中的差分編程和自動梯度計算的信息,請參閱Differential Slang:一種用于學習渲染器的著色語言。 計算機圖形學中的基本構建塊之一是 BRDF 紋理圖,它表示材料的多種特性,并描述光如何與渲染表面相互作用。藝術家創作和預覽紋理,但隨后渲染算法會自動轉換紋理,例如過濾、混合 BRDF 屬性或創建 mipmaps。 渲染是高度非線性的,因此紋理貼圖上的線性操作不會產生正確的線性變化外觀。
Source
]]>
8056
-
Differential Slang:一種用于學習渲染器的著色語言
http://www.open-lab.net/zh-cn/blog/differentiable-slang-a-shading-language-for-renderers-that-learn/
Sun, 22 Oct 2023 06:28:33 +0000
http://www.open-lab.net/zh-cn/blog/?p=8061
Continued]]>
NVIDIA 最近發布了 SIGGRAPH Asia 2023 的研究論文,SLANG.D:快速、模塊化和可微分的著色器編程。這篇論文展示了一種語言如何作為一個統一的平臺進行實時、反向和可微分的繪制。這項工作是麻省理工學院、加州大學圣地亞哥分校、華盛頓大學和 NVIDIA 研究人員的合作成果。 這是關于可微分俚語系列的一部分。有關 Slang 與各種機器學習( ML )渲染應用程序的實際示例的更多信息,請參閱 Differential Slang:應用實例。 Slang 是一種用于實時圖形編程的開源語言,它為編寫和維護大規模、高性能、跨平臺的圖形代碼庫帶來了新的功能。Slang 使現代語言結構適應實時圖形的高性能需求,并為 Direct 3D 12、Vulkan、OptiX、CUDA 和 CPU 生成代碼。 雖然 Slang 最初是一個研究項目,
Source
]]>
8061
-
借助 NVIDIA Jetson 優化功耗
http://www.open-lab.net/zh-cn/blog/power-optimization-with-nvidia-jetson/
Thu, 05 Oct 2023 04:20:34 +0000
http://www.open-lab.net/zh-cn/blog/?p=7948
Continued]]>
在使用嵌入式系統時,Jetson modules 是非常重要的。此外,您必須根據功耗預算和計算資源來優化應用程序。為了避免性能甚至是熱調節問題,監控這些資源變得非常重要。 Jetson 模組采用 GPU、CPU 和各種 AI 加速器設計,還具有高效電源管理集成電路 (PMIC)、電壓調節器和功率樹,可優化能效。 NVIDIA 提供多種工具和資源,可幫助您利用功率架構并優化資源使用: 每個 Jetson 模塊都支持多個預配置功率模式,這些模式針對特定功率預算進行了優化:10 瓦、15 瓦、30 瓦等。對于每個功率預算,在資源利用率方面都有各種可能的配置。 這些電源模式設置為 nvpmodel。您可以選擇使用其中一種預配置模式,也可以創建根據您的要求調整的自定義功率模式。nvpmodel 配置支持一定數量的在線 GPU TPC、CPU、DLA 和 PVA 核心,
Source
]]>
7948
-
加速向量搜索:RAPIDS RAFT IVF-Flat 近似算法
http://www.open-lab.net/zh-cn/blog/accelerated-vector-search-approximating-with-rapids-raft-ivf-flat/
Mon, 02 Oct 2023 04:45:11 +0000
http://www.open-lab.net/zh-cn/blog/?p=7963
Continued]]>
執行詳盡的精確 k 最近鄰 (kNN) 搜索,也稱為暴力搜索,成本高昂,并且它不能很好地擴展到更大的數據集。在向量搜索期間,暴力搜索需要計算每個查詢向量和數據庫向量之間的距離。對于常用的歐幾里德和余弦距離,計算任務等同于大型矩陣乘法。 雖然 GPU 在執行矩陣乘法方面效率很高,但隨著數據量的增加,計算成本變得令人望而卻步。然而,許多應用程序不需要精確的結果,而是可以為了更快的搜索而犧牲一些準確性。當不需要精確的結果時,近似最近鄰 (ANN) 方法通常可以減少搜索期間必須執行的距離計算的數量。 本文主要介紹了 IVF-Flat,這是 NVIDIA RAPIDS RAFT 中的一種方法。IVF-Flat 方法使用原始(即Flat)向量的倒排索引 (IVF)。此算法提供了簡單的調整手段,以減少整體搜索空間并在準確性和速度之間進行權衡。 為了幫助您了解如何使用 IVF-Flat,
Source
]]>
7963
-
新視頻系列: CUDA 開發者工具教程
http://www.open-lab.net/zh-cn/blog/new-video-series-cuda-developer-tools-tutorials/
Mon, 25 Sep 2023 05:25:59 +0000
http://www.open-lab.net/zh-cn/blog/?p=7918
Continued]]>
GPU 加速 實現了比以往任何時候都更快、更智能的應用程序。 CUDA Toolkit 是在 NVIDIA GPU 上實現加速的關鍵。然而,調試、分析和優化 CUDA 可能是一個挑戰,尤其是當您無法檢查硬件級別的吞吐量和性能時。為了幫助您駕馭 CUDA 加速,NVIDIA 提供了 Nsight 開發者工具。 CUDA 開發者工具 是一個新的教程視頻系列,旨在幫助您開始使用 CUDA 開發工具。通過這些視頻,您可以提升自己的技能,將我們的示例應用到您自己的開發環境,并隨時了解最新的特性和功能。這些視頻將引導您了解如何分析性能報告,提供調試技巧和竅門,并向您展示優化 CUDA 代碼的最佳方法。 現在觀看本系列的前三個教程。 CUDA 開發者工具 | NVIDIA Nsight 工具生態系統 向您介紹 NVIDIA 提供的工具套件。了解如何使用每一個工具,
Source
]]>
7918
人人超碰97caoporen国产