Development & Optimization

2025年 5月 9日
CUDA C++ 編譯器更新對 ELF 可見性和鏈接影響
在下一個 CUDA 主要版本 CUDA 13.0 中,NVIDIA 將對 NVIDIA CUDA 編譯器驅動程序 (NVCC)…
4 MIN READ

2025年 5月 2日
CUDA 入門教程:更簡單的介紹 (更新版)
注意:本博文最初發布于 2017 年 1 月 25 日,但已進行編輯以反映新的更新。 本文非常簡單地介紹了 CUDA,
5 MIN READ

2025年 5月 1日
借助超參數優化實現堆疊泛化:使用 NVIDIA cuML 在15分鐘內最大化準確性
堆疊泛化是機器學習 (ML) 工程師廣泛使用的技術,通過組合多個模型來提高整體預測性能。另一方面,超參數優化 (HPO)…
3 MIN READ

2025年 5月 1日
NVIDIA Blackwell 和 NVIDIA CUDA 12.9 引入基于系列的架構特性
最早進入 NVIDIA GPU CUDA 平臺的架構設計決策之一是支持 GPU 代碼的向后兼容性。這種設計意味著,
3 MIN READ

2025年 4月 29日
Kaggle 大師揭秘數據科學超能力的獲勝策略
來自 NVIDIA 的 Kaggle Grandmaster David Austin 和 Chris Deotte 以及 HP 的…
2 MIN READ

2025年 4月 23日
NVIDIA cuPyNumeric 25.03 現已完全開源,支持 PIP 和 HDF5
NVIDIA cuPyNumeric 是一個庫,旨在為基于 Legate 框架構建的 NumPy 提供分布式和加速的插入式替換。
2 MIN READ

2025年 4月 23日
利用 NVIDIA DesignWorks 實現實時 GPU 加速的高斯體渲染示例 vk_gaussian_splatting
高斯射是一種渲染復雜 3D 場景的新穎方法,可將這些場景表示為 3D 空間中各向異性 Gaussians 的集合。
1 MIN READ

2025年 4月 21日
使用 NVIDIA TensorRT 優化基于 Transformer 的擴散模型以生成視頻
先進的圖像擴散模型需要數十秒才能處理單張圖像。這使得視頻擴散更具挑戰性,需要大量計算資源和高昂成本。
4 MIN READ

2025年 4月 16日
宣布推出基于 CUDA 評估 LLM 的開源框架 ComputeEval
大語言模型 (LLMs) 正在徹底改變開發者的編碼方式和編碼學習方式。對于經驗豐富的或初級的開發者來說,
1 MIN READ

2025年 4月 3日
使用 GPU 加速 Apache Spark 上的 Apache Parquet 掃描
隨著各行各業企業的數據規模不斷增長, Apache Parquet 已成為一種重要的數據存儲格式。
3 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍
在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下, 大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時,
3 MIN READ

2025年 3月 25日
借助 NVIDIA Mission Control 實現 AI 工廠自動化
DeepSeek-R1 等先進的 AI 模型證明,企業現在可以構建專用于自己的數據和專業知識的尖端 AI 模型。
2 MIN READ

2025年 3月 20日
NVIDIA 展示用于游戲 AI 推理和簡化實操機會的 GeForce NOW
NVIDIA 云游戲服務 GeForce NOW 為開發者和發行商提供新工具,讓更多游戲玩家暢玩他們的游戲,并提供只有通過云才能實現的新體驗。
1 MIN READ

2025年 3月 18日
隆重推出 NVIDIA Dynamo:用于擴展推理AI模型的低延遲分布式推理框架
NVIDIA 今天在 GTC 2025 宣布發布 NVIDIA Dynamo 。NVIDIA Dynamo 是一個高吞吐量、
4 MIN READ

2025年 3月 12日
了解 CUDA GPU 計算的匯編語言 PTX
并行線程執行(PTX)是一種虛擬機指令集架構,從一開始就是 CUDA 的一部分。您可以將 PTX 視為 NVIDIA CUDA GPU…
4 MIN READ

2025年 3月 10日
優化 CUDA C++ 編譯時間
在現代軟件開發中,時間是非常寶貴的資源,尤其是在編譯過程中。對于在大規模 GPU 加速應用程序上使用 CUDA C++的開發者而言,
2 MIN READ