生成型人工智能

2025年 6月 4日
通過自校正 AI 工作流簡化交易捕獲和評估
LLM 在聊天和數字助理應用中的成功讓人們對其在業務流程自動化方面的潛力寄予厚望。雖然在此類工作流程中實現人類水準的可靠性一直具有挑戰性,
2 MIN READ

2025年 6月 4日
NVIDIA Blackwell 在 MLPerf Training v5.0 中實現高達 2.6 倍的性能提升
創建先進的大語言模型 (LLM) 的過程始于預訓練過程。預訓練最先進的模型具有很高的計算要求,因為熱門的開放權重模型具有數百億到數千億個參數,
3 MIN READ

2025年 6月 4日
重現 NVIDIA MLPerf v5.0 的 LLM 基準測試訓練成績
運行 NVIDIA 基準測試時,您的系統需要具備以下內容: 運行 NVIDIA MLPerf 訓練基準測試需要:
4 MIN READ

2025年 5月 28日
聚焦:使用 Iguazio 的 MLRun 和 NVIDIA NIM 構建可擴展和可觀察的 AI 以投入生產
Iguazio (被麥肯錫收購) 與 NVIDIA 的合作使企業組織能夠構建生產級 AI 解決方案,這些解決方案不僅具有高性能和可擴展性,
2 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上分析大型語言模型訓練工作流
AI 的快速發展催生了模型大小呈指數級增長的時代,特別是在大語言模型 (LLMs) 領域。這些模型憑借其變革能力,正在推動各行各業的創新。
3 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上訓練大型語言模型的高級優化策略
雖然分析有助于識別效率低下的情況,但高級優化策略對于解決硬件限制和有效擴展 AI 工作負載至關重要。在本文中,我們將探討 CPU 卸載、
3 MIN READ

2025年 5月 23日
AI 將腦部 MRI 轉化為潛在的中風預測因子
研究人員使用 AI 分析常規腦部掃描,發現了一種前景良好的新方法,可以可靠地識別常見但難以檢測的多中風先兆。
1 MIN READ

2025年 5月 23日
更智能、更安全地串流:了解 NVIDIA NeMo Guardrails 如何增強 LLM 輸出串流
LLM 流式傳輸會在生成模型響應時,逐個 token 實時遞增發送該響應。
2 MIN READ

2025年 5月 23日
LLM 推理、AI 智能體和測試時間縮放的簡單介紹
智能體一直是應用大語言模型 (LLMs) 解決復雜問題的主要驅動力。自 2023 年 AutoGPT 以來,
2 MIN READ

2025年 5月 22日
Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用戶門檻
NVIDIA 的大語言模型 (LLM) 推理速度創下了世界紀錄。在包含 400 億參數的 Llama 4 Maverick 模型 (…
3 MIN READ

2025年 5月 21日
NVIDIA Dynamo 加速 llm-d 社區計劃,推動大規模分布式推理
在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。
1 MIN READ

2025年 5月 20日
NVIDIA Dynamo 新增 GPU 自動縮放、Kubernetes 自動化和網絡優化功能
在 NVIDIA GTC 2025 上,我們宣布推出 NVIDIA Dynamo ,這是一種高吞吐量、低延遲的開源推理服務框架,
2 MIN READ

2025年 5月 19日
NVIDIA TensorRT for RTX 在 Windows 11 上推出優化的推理 AI 庫
在 Windows 上,創意、游戲和生產力應用方面的 AI 體驗正在迅速擴展。有各種框架可用于在臺式機、
3 MIN READ

2025年 5月 18日
聚焦:Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 實現個性化的數字化美妝體驗
增強現實 (AR) 和 AI 通過提供從虛擬試用到 AI 驅動的造型推薦等超個性化體驗,正在徹底改變美妝和時尚行業。
1 MIN READ

2025年 5月 18日
宣布推出適用于基準測試 AI 云基礎設施的 NVIDIA 示例云
長期以來,在云端訓練 大語言模型 (LLMs) 和部署 AI 工作負載的開發者和企業一直面臨著一項根本性挑戰:
1 MIN READ

2025年 5月 16日
借助 Mistral Medium 3 和 NVIDIA NIM 構建智能體并了解長文檔
構建功能強大的多模態應用的開發者現在可以使用 Mistral Medium 3,獲得專為企業級性能而設計的全新先進模型。
1 MIN READ