Development & Optimization

2025年 5月 9日

CUDA C++ 編譯器更新對 ELF 可見性和鏈接影響

在下一個 CUDA 主要版本 CUDA 13.0 中，NVIDIA 將對 NVIDIA CUDA 編譯器驅動程序 (NVCC)…

4 MIN READ

2025年 5月 2日

CUDA 入門教程：更簡單的介紹 (更新版)

注意：本博文最初發布于 2017 年 1 月 25 日，但已進行編輯以反映新的更新。本文非常簡單地介紹了 CUDA，

5 MIN READ

2025年 5月 1日

借助超參數優化實現堆疊泛化：使用 NVIDIA cuML 在15分鐘內最大化準確性

堆疊泛化是機器學習 (ML) 工程師廣泛使用的技術，通過組合多個模型來提高整體預測性能。另一方面，超參數優化 (HPO)…

3 MIN READ

2025年 5月 1日

NVIDIA Blackwell 和 NVIDIA CUDA 12.9 引入基于系列的架構特性

最早進入 NVIDIA GPU CUDA 平臺的架構設計決策之一是支持 GPU 代碼的向后兼容性。這種設計意味著，

3 MIN READ

2025年 4月 29日

Kaggle 大師揭秘數據科學超能力的獲勝策略

來自 NVIDIA 的 Kaggle Grandmaster David Austin 和 Chris Deotte 以及 HP 的…

2 MIN READ

2025年 4月 23日

NVIDIA cuPyNumeric 25.03 現已完全開源，支持 PIP 和 HDF5

NVIDIA cuPyNumeric 是一個庫，旨在為基于 Legate 框架構建的 NumPy 提供分布式和加速的插入式替換。

2 MIN READ

2025年 4月 23日

利用 NVIDIA DesignWorks 實現實時 GPU 加速的高斯體渲染示例 vk_gaussian_splatting

高斯射是一種渲染復雜 3D 場景的新穎方法，可將這些場景表示為 3D 空間中各向異性 Gaussians 的集合。

1 MIN READ

2025年 4月 21日

使用 NVIDIA TensorRT 優化基于 Transformer 的擴散模型以生成視頻

先進的圖像擴散模型需要數十秒才能處理單張圖像。這使得視頻擴散更具挑戰性，需要大量計算資源和高昂成本。

4 MIN READ

2025年 4月 16日

宣布推出基于 CUDA 評估 LLM 的開源框架 ComputeEval

大語言模型 (LLMs) 正在徹底改變開發者的編碼方式和編碼學習方式。對于經驗豐富的或初級的開發者來說，

1 MIN READ

2025年 4月 3日

使用 GPU 加速 Apache Spark 上的 Apache Parquet 掃描

隨著各行各業企業的數據規模不斷增長， Apache Parquet 已成為一種重要的數據存儲格式。

3 MIN READ

2025年 4月 2日

NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍

在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下，大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時，

3 MIN READ

2025年 3月 25日

借助 NVIDIA Mission Control 實現 AI 工廠自動化

DeepSeek-R1 等先進的 AI 模型證明，企業現在可以構建專用于自己的數據和專業知識的尖端 AI 模型。

2 MIN READ

2025年 3月 20日

NVIDIA 展示用于游戲 AI 推理和簡化實操機會的 GeForce NOW

NVIDIA 云游戲服務 GeForce NOW 為開發者和發行商提供新工具，讓更多游戲玩家暢玩他們的游戲，并提供只有通過云才能實現的新體驗。

1 MIN READ

2025年 3月 18日

隆重推出 NVIDIA Dynamo：用于擴展推理AI模型的低延遲分布式推理框架

NVIDIA 今天在 GTC 2025 宣布發布 NVIDIA Dynamo 。NVIDIA Dynamo 是一個高吞吐量、

4 MIN READ

2025年 3月 12日

了解 CUDA GPU 計算的匯編語言 PTX

并行線程執行（PTX）是一種虛擬機指令集架構，從一開始就是 CUDA 的一部分。您可以將 PTX 視為 NVIDIA CUDA GPU…

4 MIN READ

2025年 3月 10日

優化 CUDA C++ 編譯時間

在現代軟件開發中，時間是非常寶貴的資源，尤其是在編譯過程中。對于在大規模 GPU 加速應用程序上使用 CUDA C++的開發者而言，

2 MIN READ