教程

2025年 5月 27日
在 NVIDIA Grace Hopper 上分析大型語言模型訓練工作流
AI 的快速發展催生了模型大小呈指數級增長的時代,特別是在大語言模型 (LLMs) 領域。這些模型憑借其變革能力,正在推動各行各業的創新。
3 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上訓練大型語言模型的高級優化策略
雖然分析有助于識別效率低下的情況,但高級優化策略對于解決硬件限制和有效擴展 AI 工作負載至關重要。在本文中,我們將探討 CPU 卸載、
3 MIN READ

2025年 5月 23日
更智能、更安全地串流:了解 NVIDIA NeMo Guardrails 如何增強 LLM 輸出串流
LLM 流式傳輸會在生成模型響應時,逐個 token 實時遞增發送該響應。
2 MIN READ

2025年 5月 23日
利用 NVIDIA DALI 的最新技術實現高效數據處理
NVIDIA DALI 是一個用于解碼和增強圖像、視頻和語音的便攜式開源軟件庫,最近推出了多項功能,可提高性能并支持 DALI 的新用例。
2 MIN READ

2025年 5月 15日
使用 cuEmbed 加速嵌入查找
NVIDIA 最近發布了 cuEmbed,這是一個高性能、僅使用標頭的 CUDA 庫,可加速 NVIDIA GPU 上的嵌入查找。
2 MIN READ

2025年 5月 15日
印第安納瓊斯? 中的路徑追蹤優化:透明度 MicroMaps 和動態 BLAS 壓縮
本系列第一篇文章是 “ Indiana Jones ™ 中的路徑追蹤優化:Shader Execution Reordering 和…
5 MIN READ

2025年 5月 15日
使用 NVIDIA CUDA-X 和 Coiled 簡化云端環境設置并加速數據科學運算
想象一下,分析紐約市數百萬次的拼車旅程 — — 跟蹤各自治市的模式、比較服務定價或確定有利可圖的取車地點。
4 MIN READ

2025年 5月 14日
NVIDIA TensorRT 解鎖 NVIDIA Blackwell GeForce RTX 50 系列 GPU 的 FP4 圖像生成
NVIDIA Blackwell 平臺的推出開啟了生成式 AI 技術進步的新時代。其最前沿是新推出的 GeForce RTX 50 系列…
4 MIN READ

2025年 5月 12日
在 Azure AI Foundry 上使用 NVIDIA NIM 加速 AI 推理
將 NVIDIA NIM 微服務 集成到 Azure AI Foundry ,標志著企業 AI 開發的重大飛躍。
4 MIN READ

2025年 5月 8日
擴展 NVIDIA Agent Intelligence Toolkit 以支持新的代理式框架
NVIDIA Agent Intelligence toolkit 是一個開源庫,用于高效連接和優化 AI 智能體 團隊。
4 MIN READ

2025年 5月 7日
使用 Python 通過 OpenUSD 實現 3D 工作流自動化
通用場景描述 (OpenUSD) 提供了一個強大、開放且可擴展的生態系統,用于在復雜的 3D 世界中進行描述、合成、仿真和協作。
2 MIN READ

2025年 5月 6日
LLM 推理基準測試指南:NVIDIA GenAI-Perf 和 NIM
這是 LLM 基準測試系列 的第二篇文章,介紹了在使用 NVIDIA NIM 部署 Meta Llama 3 模型 時,
4 MIN READ

2025年 5月 2日
CUDA 入門教程:更簡單的介紹 (更新版)
注意:本博文最初發布于 2017 年 1 月 25 日,但已進行編輯以反映新的更新。 本文非常簡單地介紹了 CUDA,
5 MIN READ

2025年 5月 1日
借助超參數優化實現堆疊泛化:使用 NVIDIA cuML 在15分鐘內最大化準確性
堆疊泛化是機器學習 (ML) 工程師廣泛使用的技術,通過組合多個模型來提高整體預測性能。另一方面,超參數優化 (HPO)…
3 MIN READ

2025年 4月 29日
構建應用程序以安全使用 KV 緩存
在與基于 Transformer 的模型 (如 大語言模型 (LLM) 和 視覺語言模型 (VLM)) 交互時,輸入結構會塑造模型的輸出。
2 MIN READ

2025年 4月 28日
借助代理式 AI 系統推進網絡安全運營
被動式 AI 時代已經過去。一個新時代正在開始,AI 不僅能做出響應,還能思考、計劃和行動。 大語言模型 (LLM) 的快速發展釋放了…
3 MIN READ