CUDA-X – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 10 Jul 2025 06:45:06 +0000
zh-CN
hourly
1
196178272 -
先進的 NVIDIA CUDA 內核優化技術:手寫 PTX
http://www.open-lab.net/zh-cn/blog/advanced-nvidia-cuda-kernel-optimization-techniques-handwritten-ptx/
Wed, 02 Jul 2025 06:42:30 +0000
http://www.open-lab.net/zh-cn/blog/?p=14547
Continued]]>
隨著加速計算不斷提升 AI 和科學計算各個領域的應用程序性能,人們對 GPU 優化技術的興趣也越來越濃厚,以確保應用程序獲得盡可能好的性能。作為應用程序開發者,有很多方法可以對軟件堆棧上下進行 GPU 編程。在本文中,我們將介紹堆棧的一些不同級別,并深入探討最低級別:手寫并行線程執行 (PTX) 代碼。 現在,您無需編寫特定于 GPU 的代碼,即可使用 GPU 完成大量工作。庫開發者和軟件工程師已經為您完成了底層工作。例如,您可以在堆棧中進行高級工作,使用藍圖構建完整的 AI 工作流。或者,您可以在 PyTorch 等框架中開發應用程序,您可以在其中指定模型、適當的 GPU 代碼和庫來自動執行程序。 您還可以使用全套 NVIDIA CUDA-X 庫開發應用程序,其中包括量子計算、數據處理、物理 AI、基因測序、邊緣計算、藥物研發等領域特定的庫。
Source
]]>
14547
-
NVIDIA 在制造和運營領域的 AI 應用:借助 NVIDIA CUDA-X 數據科學加速 ML 模型
http://www.open-lab.net/zh-cn/blog/ai-in-manufacturing-and-operations-at-nvidia-accelerating-ml-models-with-nvidia-cuda-x-data-science/
Wed, 18 Jun 2025 04:45:46 +0000
http://www.open-lab.net/zh-cn/blog/?p=14378
Continued]]>
從晶圓制造和電路探測到封裝芯片測試,NVIDIA 利用數據科學和機器學習來優化芯片制造和運營工作流程。這些階段會產生 TB 級的數據,而要確保質量、吞吐量和成本效益,關鍵在于快速、大規模地將這些數據轉化為切實可行的見解。多年來,我們開發了強大的 Machine Learning 流程,可解決缺陷檢測和測試優化等問題。 這是一系列博客中的第一個,這些博客將分享我們使用 NVIDIA cuDF 和 NVIDIA cuML 等 CUDA-X 庫部署此類工作流的關鍵經驗。雖然這些經驗教訓來自半導體制造,但挑戰和解決方案廣泛適用于物流、質量工程和供應鏈優化。 我們先從現實世界的分類任務開始:預測芯片是否通過特定測試。在更高級的場景中,目標擴展到預測芯片的性能箱(從 L1 到 L5),并將問題表述為多類別分類問題。 在這兩種情況下,模型會使用來自多個來源的豐富測量信號:
Source
]]>
14378
-
使用 NVIDIA CUDA-X 和 Coiled 簡化云端環境設置并加速數據科學運算
http://www.open-lab.net/zh-cn/blog/simplify-setup-and-boost-data-science-in-the-cloud-using-nvidia-cuda-x-and-coiled/
Thu, 15 May 2025 07:00:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=13971
Continued]]>
想象一下,分析紐約市數百萬次的拼車旅程 — — 跟蹤各自治市的模式、比較服務定價或確定有利可圖的取車地點。公開發布的 New York City Taxi and Limousine Commission (TLC) 行程記錄數據包含有價值的信息,可以揭示具有劃時代意義的見解,但由于數據量龐大,分析師需要等待數小時才能得出結果。 這些延遲會中斷分析流程并限制業務響應能力。出租車公司、城市規劃部門和金融公司的數據科學家需要及時獲得見解,以便做出關鍵決策。等待 9 分鐘與 5 秒之間的區別不僅在于方便,還在于競爭優勢。 現代數據科學非常適合 GPU 并行。過濾和轉換大型數據集等操作需要在數百萬個獨立數據點中應用相同的功能。在處理 NYC 拼車數據集時,GPU 可以同時評估數千次拼車的計算,而不是按順序進行,從而大幅縮短計算時間。 盡管具有這些優勢,
Source
]]>
13971
-
AI 視覺技術助力綠色回收工廠智能化
http://www.open-lab.net/zh-cn/blog/ai-vision-helps-green-recycling-plants/
Thu, 19 Dec 2024 09:05:16 +0000
http://www.open-lab.net/zh-cn/blog/?p=12480
Continued]]>
全球每年僅回收約 13% 的 20 多億噸城市垃圾。到 2050 年,全球每年的城市廢棄物量將達到 3.88 億噸。 但全球回收行業的效率遠遠不夠。每年,價值高達 120 億美元的可回收塑料 (更不用說紙張或金屬了) 最終進入垃圾填埋場,而不是使用回收材料制造的新產品。 英國的初創公司 Greyparrot 開發了一款由 AI 驅動的小型設備,可提供“廢棄物智能”功能,旨在幫助回收工廠變得更高效、更環保。 這款名為 Greyparrot Analyzer 的兩英尺方形時尚設備使用嵌入式攝像頭來識別和區分流經回收工廠的傳送帶上的材料。 該分析器使用機器學習物體檢測模型(ODM)連接到回收工廠,并幫助改造其基礎設施。ODM 根據數千萬張廢棄物圖像進行訓練,捕獲和分析快速廢棄物圖像只需不到 60 毫秒。 分析器的 ODM 使用 NVIDIA H100 Tensor…
Source
]]>
12480
人人超碰97caoporen国产