生成式人工智能/大語言模型

2025年 5月 21日

NVIDIA Dynamo 加速 llm-d 社區計劃，推動大規模分布式推理

在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。

1 MIN READ

2025年 5月 20日

NVIDIA Dynamo 新增 GPU 自動縮放、Kubernetes 自動化和網絡優化功能

在 NVIDIA GTC 2025 上，我們宣布推出 NVIDIA Dynamo ，這是一種高吞吐量、低延遲的開源推理服務框架，

2 MIN READ

2025年 5月 19日

NVIDIA TensorRT for RTX 在 Windows 11 上推出優化的推理 AI 庫

在 Windows 上，創意、游戲和生產力應用方面的 AI 體驗正在迅速擴展。有各種框架可用于在臺式機、

3 MIN READ

2025年 5月 18日

宣布推出適用于基準測試 AI 云基礎設施的 NVIDIA 示例云

長期以來，在云端訓練大語言模型 (LLMs) 和部署 AI 工作負載的開發者和企業一直面臨著一項根本性挑戰：

1 MIN READ

2025年 5月 16日

借助 Mistral Medium 3 和 NVIDIA NIM 構建智能體并了解長文檔

構建功能強大的多模態應用的開發者現在可以使用 Mistral Medium 3，獲得專為企業級性能而設計的全新先進模型。

1 MIN READ

2025年 5月 15日

人工智能幫助揭示阿爾茨海默病的潛在成因和治療方法

加州大學圣地亞哥分校的研究人員表示，可以作為阿爾茨海默病早期指標的基因實際上是退行性大腦疾病的誘因。

1 MIN READ

2025年 5月 12日

在 NVIDIA NeMo 框架的首發日支持下即時運行 Hugging Face 模型

在企業組織努力更大限度地提高其生成式 AI 投資的價值時，獲取最新的模型開發成果對于持續取得成功至關重要。通過在首發日使用先進的模型，

2 MIN READ

2025年 5月 12日

在 Azure AI Foundry 上使用 NVIDIA NIM 加速 AI 推理

將 NVIDIA NIM 微服務集成到 Azure AI Foundry ，標志著企業 AI 開發的重大飛躍。

4 MIN READ

2025年 5月 9日

應用具有推理能力的專用大語言模型（LLM）加速電池研究

人工評估材料通常會拖慢電池創新等復雜領域的科學研究，限制了每天只有數十個候選材料的進展。在這篇博客文章中，

3 MIN READ

2025年 5月 8日

擴展 NVIDIA Agent Intelligence Toolkit 以支持新的代理式框架

NVIDIA Agent Intelligence toolkit 是一個開源庫，用于高效連接和優化 AI 智能體團隊。

4 MIN READ

2025年 5月 8日

借助 3DGUT 在 gsplat 中革新神經重建和渲染

從訓練自動駕駛汽車 (AV) 到為機器人和數字孿生提供支持，逼真的 3D 仿真正在成為現代 AI 和圖形的基石。

1 MIN READ

2025年 5月 7日

使用 NVIDIA NeMo Curator 構建 Nemotron-CC：一個高質量萬億令牌數據集，用于大型語言模型預訓練，源自 Common Crawl

對于想要訓練先進的大語言模型 (LLM) 的企業開發者而言，整理高質量的預訓練數據集至關重要。為了讓開發者能夠構建高度準確的 LLM，

2 MIN READ

2025年 5月 7日

概念驅動的 AI 教學助手引導學生獲得更深入的見解

在當今的教育環境中，生成式 AI 工具既帶來了福音，也帶來了挑戰。雖然這些工具提供了前所未有的信息獲取途徑，但也引發了對學術誠信的新擔憂。

2 MIN READ

2025年 5月 6日

LLM 推理基準測試指南：NVIDIA GenAI-Perf 和 NIM

這是 LLM 基準測試系列的第二篇文章，介紹了在使用 NVIDIA NIM 部署 Meta Llama 3 模型時，

4 MIN READ

2025年 5月 2日

借助 NVIDIA 在生產應用中集成和部署 Tongyi Qwen3 模型

阿里巴巴近期發布了其開源的混合推理大語言模型（LLM）通義千問 Qwen3，此次 Qwen3 開源模型系列包含兩款混合專家模型 (MoE)…

3 MIN READ

2025年 5月 1日

借助 NVIDIA cuBLAS 12.9 提高矩陣乘法速度和靈活性

NVIDIA CUDA-X 數學庫助力開發者為 AI、科學計算、數據處理等領域構建加速應用。

3 MIN READ