高級 API 性能 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Tue, 27 Feb 2024 23:10:45 +0000 zh-CN hourly 1 196178272 借助 NVIDIA Metropolis 微服務和 API 構建邊緣視覺 AI 應用 http://www.open-lab.net/zh-cn/blog/how-to-build-vision-ai-applications-at-the-edge-with-nvidia-metropolis-microservices-and-apis/ Tue, 23 Jan 2024 08:49:52 +0000 http://www.open-lab.net/zh-cn/blog/?p=8824 Continued]]> 通過 NVIDIA Metropolis 微服務,開發者可以利用功能強大的云原生 API 和微服務來構建和定制視覺 AI 應用和解決方案。該框架現已與 NVIDIA Jetson 相結合,使得開發者能夠在邊緣快速開發高性能、成熟的視覺 AI 應用,并實現產品化。 API 通過實現不同應用和服務之間的無縫通信和集成,提高了軟件開發的靈活性、互操作性和效率。用于構建視頻分析應用的兩個常見功能是視頻流和基于 AI 的見解和分析生成。 本文介紹了用于構建視覺 AI 應用并將其集成到任何客戶端應用中的 API 工作流程。我們將介紹構建應用的三個關鍵步驟: 適用于 Jetson 的 NVIDIA Metropolis 微服務提供了一個模塊化架構,該架構包含大量可自定義、可重復使用的微服務,這些微服務用于構建視覺 AI 應用。該套件還為基礎設施功能和參考云提供了平臺服務。

Source

]]>
8824
高級 API 性能:交換鏈 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-swap-chains/ Fri, 15 Dec 2023 05:37:17 +0000 http://www.open-lab.net/zh-cn/blog/?p=8585 Continued]]> 交換鏈是如何將渲染數據輸出到屏幕的不可或缺的一部分。它們通常由一組輸出就緒型緩沖區組成,每個緩沖區都可以旋轉渲染為一個緩沖區。在渲染到交換鏈的某個緩沖區的同時,交換鏈中的其他緩沖區通常被讀取以進行顯示輸出。 本文介紹了在 NVIDIA GPU 上使用交換鏈時的最佳實踐。要在您的應用中獲得穩定的高幀率,請參閱我們的高級 API 性能提示。 在尋求提高渲染性能時,通常會專注于渲染管線中更頻繁優化的部分。但是,交換鏈通常會被忽略,從而將潛在性能和延遲放在桌面上。 以下建議和注意事項可讓您更深入地了解確保最佳交換鏈性能的最佳方法。 感謝 Cody Robson、Kumaresan Gnanasekaran、Adrian Muntianu 和 Meenal Nachnani 提供的建議和幫助。 …

Source

]]>
8585
高級 API 性能:內部函數 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-intrinsics/ Tue, 21 Nov 2023 04:45:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=8292 Continued]]> Intrinsics 可被視為特定硬件指令的更高級別的抽象。它們提供對低級操作或特定于硬件的功能的直接訪問,從而提高性能。這樣,就可以在線程束中的線程間執行操作,也稱為線程束中的線程波前. 以下代碼示例是 SM6 的示例: …

Source

]]>
8292
高級 API 性能:描述符 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-descriptors/ Fri, 27 Oct 2023 06:46:54 +0000 http://www.open-lab.net/zh-cn/blog/?p=8085 Continued]]> 通過使用描述符類型,您可以將資源綁定到著色器,并指定如何訪問這些資源。這可在 CPU 和 GPU 之間實現高效通信,并使著色器能夠在渲染期間訪問必要的數據。 …

Source

]]>
8085
高級 API 性能:調試 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-debugging/ Fri, 13 Oct 2023 06:19:04 +0000 http://www.open-lab.net/zh-cn/blog/?p=8018 Continued]]> NVIDIA 提供了大量的圖形調試工具,包括 NVIDIA Nsight System 用于 CPU 調試,Nsight Graphics 用于 GPU 調試。而 Nsight Aftermath 則可用于分析崩潰轉儲文件。 感謝 Patrick Neill、Jeffrey Kiel、Justin Kim、Andrew Allan 和 Louis Bavoil 在本文中的幫助。 …

Source

]]>
8018
高級 API 性能:著色器 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-shaders/ Fri, 01 Sep 2023 05:25:39 +0000 http://www.open-lab.net/zh-cn/blog/?p=7774 Continued]]> 本文介紹在 NVIDIA GPU 上使用著色器時的最佳實踐。要在應用程序中獲得高且一致的幀速率,請參閱高級 API 性能小貼士。 著色器通過使您能夠控制渲染過程的各個方面,在圖形編程中發揮著關鍵作用。它們在 GPU 上運行,負責操作頂點、像素和其他數據。 這些提示適用于所有類型的著色器。 計算著色器用于從數據處理和模擬到機器學習的通用計算。 像素著色器,也稱為片段著色器,用于按像素計算效果。 頂點著色器用于在逐頂點的基礎上計算效果。 幾何體、域和外殼著色器用于控制、評估和生成幾何體,從而使鑲嵌能夠創建曲面和對象的動態生成。 感謝 Ryan Prescott、Ana Mihut、Katherine Sun 和 Ivan Fedorov。 …

Source

]]>
7774
高級 API 性能:管道狀態對象 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-pipeline-state-objects/ Tue, 18 Jul 2023 05:36:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=7431 Continued]]> 管道狀態對象( PSO )定義了在向 GPU 提交工作時硬件如何解釋和渲染輸入數據。 PSO 的正確管理對于系統資源的最佳使用和游戲的順利進行至關重要。 本文介紹了在 NVIDIA GPU 上使用管道狀態對象時的最佳實踐。要在應用程序中獲得高性能且一致的幀速率,請參考高級 API 性能技巧。 感謝 Patrick Neil 和 Dhiraj Kumar 的建議和幫助。 …

Source

]]>
7431
高級 API 性能: CPU http://www.open-lab.net/zh-cn/blog/advanced-api-performance-cpus/ Wed, 17 May 2023 04:33:41 +0000 http://www.open-lab.net/zh-cn/blog/?p=6962 Continued]]> 本文介紹了使用 NVIDIA GPU 時的 CPU 最佳實踐。要在應用程序中獲得高且一致的幀速率,請參閱高級API 性能提示。 要從 NVIDIA GPU 中獲得最佳性能,請將其與 CPU 上的高效工作委派配對。幀速率上限、卡頓和其他低于標準的應用程序性能事件通常可以追溯到 CPU 上的瓶頸。使用以下技巧來了解你應該做什么以及應該避免什么。 再多的 GPU 工作優化也無法克服 CPU 瓶頸。均勻平衡所有線程的工作,以獲得最佳效果。 向 GPU 提交一個命令列表數組( ECL )以供執行。 NVIDIA 硬件支持多個命令隊列以并行化圖形工作,使圖形計算或計算工作能夠同時執行。 創建和銷毀緩沖區、紋理和著色器是高效計算機圖形的基礎。 光線跟蹤加速結構是組織場景的幾何信息以優化光線和場景對象之間的相交測試的數據結構。

Source

]]>
6962
高級 API 性能:采樣器反饋 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-sampler-feedback/ Thu, 04 May 2023 03:44:37 +0000 http://www.open-lab.net/zh-cn/blog/?p=6933 Continued]]> 本文介紹了在 NVIDIA GPU 上使用采樣器反饋的最佳實踐。要在應用程序中獲得高且一致的幀速率,請參閱高級API 性能提示. 采樣器反饋是 DirectX 12 Ultimate 的一項功能,用于捕獲和記錄紋理采樣信息和位置。采樣器反饋旨在為流和紋理空間著色提供更好的支持。本文介紹了 NVIDIA GPU 上采樣器反饋使用的最佳實踐和注意事項。 感謝 Rahul Sathe 和 Adam Moss 的建議和反饋。 …

Source

]]>
6933
人人超碰97caoporen国产