生成式人工智能/大語言模型

2025年 5月 21日
NVIDIA Dynamo 加速 llm-d 社區計劃,推動大規模分布式推理
在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。
1 MIN READ

2025年 5月 20日
NVIDIA Dynamo 新增 GPU 自動縮放、Kubernetes 自動化和網絡優化功能
在 NVIDIA GTC 2025 上,我們宣布推出 NVIDIA Dynamo ,這是一種高吞吐量、低延遲的開源推理服務框架,
2 MIN READ

2025年 5月 19日
NVIDIA TensorRT for RTX 在 Windows 11 上推出優化的推理 AI 庫
在 Windows 上,創意、游戲和生產力應用方面的 AI 體驗正在迅速擴展。有各種框架可用于在臺式機、
3 MIN READ

2025年 5月 18日
宣布推出適用于基準測試 AI 云基礎設施的 NVIDIA 示例云
長期以來,在云端訓練 大語言模型 (LLMs) 和部署 AI 工作負載的開發者和企業一直面臨著一項根本性挑戰:
1 MIN READ

2025年 5月 16日
借助 Mistral Medium 3 和 NVIDIA NIM 構建智能體并了解長文檔
構建功能強大的多模態應用的開發者現在可以使用 Mistral Medium 3,獲得專為企業級性能而設計的全新先進模型。
1 MIN READ

2025年 5月 15日
人工智能幫助揭示阿爾茨海默病的潛在成因和治療方法
加州大學圣地亞哥分校的研究人員表示,可以作為阿爾茨海默病早期指標的基因實際上是 退行性大腦疾病的誘因 。
1 MIN READ

2025年 5月 12日
在 NVIDIA NeMo 框架的首發日支持下即時運行 Hugging Face 模型
在企業組織努力更大限度地提高其 生成式 AI 投資的價值時,獲取最新的模型開發成果對于持續取得成功至關重要。通過在首發日使用先進的模型,
2 MIN READ

2025年 5月 12日
在 Azure AI Foundry 上使用 NVIDIA NIM 加速 AI 推理
將 NVIDIA NIM 微服務 集成到 Azure AI Foundry ,標志著企業 AI 開發的重大飛躍。
4 MIN READ

2025年 5月 9日
應用具有推理能力的專用大語言模型(LLM)加速電池研究
人工評估材料通常會拖慢電池創新等復雜領域的科學研究,限制了每天只有數十個候選材料的進展。在這篇博客文章中,
3 MIN READ

2025年 5月 8日
擴展 NVIDIA Agent Intelligence Toolkit 以支持新的代理式框架
NVIDIA Agent Intelligence toolkit 是一個開源庫,用于高效連接和優化 AI 智能體 團隊。
4 MIN READ

2025年 5月 8日
借助 3DGUT 在 gsplat 中革新神經重建和渲染
從訓練自動駕駛汽車 (AV) 到為機器人和數字孿生提供支持,逼真的 3D 仿真正在成為現代 AI 和圖形的基石。
1 MIN READ

2025年 5月 7日
使用 NVIDIA NeMo Curator 構建 Nemotron-CC:一個高質量萬億令牌數據集,用于大型語言模型預訓練,源自 Common Crawl
對于想要訓練先進的 大語言模型 (LLM) 的企業開發者而言,整理高質量的預訓練數據集至關重要。為了讓開發者能夠構建高度準確的 LLM,
2 MIN READ

2025年 5月 7日
概念驅動的 AI 教學助手引導學生獲得更深入的見解
在當今的教育環境中,生成式 AI 工具既帶來了福音,也帶來了挑戰。雖然這些工具提供了前所未有的信息獲取途徑,但也引發了對學術誠信的新擔憂。
2 MIN READ

2025年 5月 6日
LLM 推理基準測試指南:NVIDIA GenAI-Perf 和 NIM
這是 LLM 基準測試系列 的第二篇文章,介紹了在使用 NVIDIA NIM 部署 Meta Llama 3 模型 時,
4 MIN READ

2025年 5月 2日
借助 NVIDIA 在生產應用中集成和部署 Tongyi Qwen3 模型
阿里巴巴近期發布了其開源的混合推理大語言模型(LLM)通義千問 Qwen3,此次 Qwen3 開源模型系列包含兩款混合專家模型 (MoE)…
3 MIN READ

2025年 5月 1日
借助 NVIDIA cuBLAS 12.9 提高矩陣乘法速度和靈活性
NVIDIA CUDA-X 數學庫助力開發者為 AI、科學計算、數據處理等領域構建加速應用。
3 MIN READ