Hopper

2025年 5月 1日

借助 NVIDIA cuBLAS 12.9 提高矩陣乘法速度和靈活性

NVIDIA CUDA-X 數學庫助力開發者為 AI、科學計算、數據處理等領域構建加速應用。

3 MIN READ

2025年 4月 2日

NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍

在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下，大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時，

3 MIN READ

2025年 3月 3日

AI 模型為環保人士提供大規模保護漁業和野生動物的新工具

為了遏制非法捕撈，研究人員發布了一個新的開源 AI 模型，該模型可以準確識別世界上幾乎所有的航海船只的行為，包括船只是否可能非法捕撈。

1 MIN READ

2025年 2月 28日

聚焦：NAVER Place 利用 NVIDIA TensorRT-LLM 優化 SLM 基礎的垂直服務

NAVER 是一家韓國熱門搜索引擎公司，提供 Naver Place ，這是一項基于地理的服務，可提供有關韓國數百萬家企業和興趣點的詳細信息。

4 MIN READ

2025年 2月 28日

使用 DeepSeek-R1 NIM 構建具有專家推理功能的 AI 智能體

AI 智能體正在通過實現流程自動化、優化決策制定和簡化操作來改變業務運營。其有效性取決于專家推理，從而實現更明智的規劃和高效執行。

2 MIN READ

2025年 2月 20日

聚焦：東京大學使用 NVIDIA Grace Hopper 進行開創性的節能地震研究

超級計算機是推動突破性發現的引擎。從預測極端天氣到推進疾病研究，以及設計更安全、更高效的基礎設施，這些機器可以模擬因規模、

2 MIN READ

2025年 2月 13日

使用 DeepSeek-R1 和推理時間縮放實現自動化 GPU 內核生成

隨著 AI 模型擴展其功能以解決更復雜的挑戰，一種稱為“ 測試時擴展 ”或“ 推理時擴展 ”的新擴展法則正在出現。

2 MIN READ

2025年 2月 10日

NVIDIA Grace CPU 與 Arm 軟件生態系統集成

NVIDIA Grace CPU 將節能高效的性能提升到了新的高度，正在改變數據中心的設計。Grace CPU 專為數據中心規模打造，

2 MIN READ

2025年 2月 5日

NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可編程性

矩陣乘法和注意力機制是現代 AI 工作負載的計算支柱。雖然庫如 NVIDIA cuDNN 提供高度優化的實現，

2 MIN READ

2025年 2月 4日

新的 AI 模型提供癌癥細胞級視圖

研究癌癥的研究人員推出了一種新的 AI 模型，該模型提供了癌細胞的細胞級映射和可視化，

1 MIN READ

2025年 1月 31日

CUDA 工具包現已支持 NVIDIA Blackwell 架構

CUDA 工具包的最新版本 (版本 12.8) 使用最新的 NVIDIA CPU 和 GPU，持續提升數據科學、AI、

3 MIN READ

2024年 12月 16日

2024 年熱門文章：NVIDIA NIM、語言模型突破和數據科學優化的精要

對于使用 NVIDIA 技術的開發者、研究人員和創新者來說，2024 年又是具有里程碑意義的一年。

2 MIN READ

2024年 11月 19日

Llama 3.2 全棧優化釋放 NVIDIA GPU 的高性能

Meta 最近發布了 Llama 3.2 系列視覺語言模型（VLM），其中包含 11B 參數和 90B 參數變體。這些模型是多模態模型，

2 MIN READ

2024年 11月 19日

NVIDIA cuDSS 庫推動美國電網優化無障礙發展

隨著電力需求不斷增長，電網的電力系統優化（PSO）對于確保高效的資源管理、可持續性和能源安全至關重要。東部互聯是北美的主要電網，

2 MIN READ

2024年 11月 14日

探索采用自主 AI 和 NVIDIA 機密計算的超級協議案例

機密和自主的 AI 是一種新的 AI 開發、訓練和推理方法，其中用戶的數據是去中心化的、私有的，并由用戶自己控制。

3 MIN READ

2024年 11月 11日

使用 NVIDIA Megatron-LM 構建強大日語能力的 1720 億語言模型

生成式 AI 具有創建全新內容的能力，這是傳統機器學習（ML）方法難以實現的。在自然語言處理（NLP）領域，大型語言模型（LLMs）…

2 MIN READ