教程

2025年 6月 27日
如何在 Polars GPU 引擎中處理超過 VRAM 的數據
在量化金融、算法交易和欺詐檢測等高風險領域,數據從業者經常需要處理數百 GB 的數據,才能快速做出明智的決策。
1 MIN READ

2025年 6月 25日
如何使用 NVIDIA NeMo 技能簡化復雜的 LLM 工作流程
改進 LLM 的典型方法涉及多個階段:合成數據生成 (SDG) 、通過監督式微調 (SFT) 或強化學習 (RL) 進行模型訓練以及模型評估。
4 MIN READ

2025年 6月 24日
借助 NVIDIA Isaac Manipulator 和 Vention Machine 提高工業機器人的靈活性 Motion AI
隨著工業自動化的加速,工廠越來越依賴先進的機器人技術來提高生產力和運營彈性。機器人的成功部署取決于精確的運動規劃、
2 MIN READ

2025年 6月 18日
基準測試大型語言模型推理成本以實現更智能的擴展和部署
這是大語言模型延遲-吞吐量基準測試系列的第三篇博文,旨在指導開發者如何通過估算總體擁有成本 (TCO) 來確定 LLM 推理的成本。
3 MIN READ

2025年 6月 18日
借助 NVIDIA NIM 推理微服務和 ITMonitron 實現實時 IT 事故檢測和情報
在當今快節奏的 IT 環境中,并非所有事件都始于明顯的警報。這些問題可能始于細微的分散信號、錯過的警報、悄無聲息的 SLO 漏洞,
2 MIN READ

2025年 6月 18日
使用一個 GPU 運行多模態提取以實現更高效的 AI 工作流
隨著企業生成和使用越來越多的多樣化數據,從 PDF 和演示文稿等多模態文檔中提取見解已成為一項重大挑戰。
4 MIN READ

2025年 6月 17日
R2D2:利用 NVIDIA Research 構建AI驅動的3D機器人感知與地圖構建技術
機器人必須感知和解釋其 3D 環境,才能安全有效地行動。這對于非結構化或陌生空間中的自主導航、對象操作和遠程操作等任務尤為重要。
3 MIN READ

2025年 6月 13日
使用 FlashInfer 運行 NVIDIA 的高性能 LLM 推理內核
出色的 LLM 推理需要兩個關鍵要素:速度和開發者速度。速度是指通過使用高度優化的計算內核算法,最大限度地提高底層硬件的效率。
2 MIN READ

2025年 6月 11日
使用開源 NVIDIA cuOpt 加速決策優化
企業每天都會做出成千上萬的決策,包括生產什么、在哪里發貨、如何分配資源。大規模優化這些決策成為一項計算挑戰。線性規劃 (LP) 、
2 MIN READ

2025年 6月 11日
借助統一的 NVIDIA NIM 工作流簡化 LLM 部署和 AI 推理
將大語言模型 (LLM) 集成到真實用戶與之大規模交互的生產環境中,是任何 AI 工作流中最重要的部分。這不僅僅是讓模型運行,
3 MIN READ

2025年 6月 4日
借助 NVIDIA 多進程服務更大限度地提高 OpenMM 分子動力學吞吐量
分子動力學 (MD) 模擬模擬原子在一段時間內的相互作用,并且需要強大的計算能力。然而,許多模擬的系統規模很小 (約 400K 個原子) ,
3 MIN READ

2025年 5月 30日
借助 NVIDIA NIM 加速 Vanna 上的文本到 SQL 推理,從而提升分析效率
從自然語言輸入生成查詢緩慢且效率低下,是決策制定的瓶頸。這迫使分析師和業務用戶嚴重依賴數據團隊,從而延遲洞察并限制敏捷性。
4 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上分析大型語言模型訓練工作流
AI 的快速發展催生了模型大小呈指數級增長的時代,特別是在大語言模型 (LLMs) 領域。這些模型憑借其變革能力,正在推動各行各業的創新。
3 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上訓練大型語言模型的高級優化策略
雖然分析有助于識別效率低下的情況,但高級優化策略對于解決硬件限制和有效擴展 AI 工作負載至關重要。在本文中,我們將探討 CPU 卸載、
3 MIN READ

2025年 5月 23日
更智能、更安全地串流:了解 NVIDIA NeMo Guardrails 如何增強 LLM 輸出串流
LLM 流式傳輸會在生成模型響應時,逐個 token 實時遞增發送該響應。
2 MIN READ

2025年 5月 23日
利用 NVIDIA DALI 的最新技術實現高效數據處理
NVIDIA DALI 是一個用于解碼和增強圖像、視頻和語音的便攜式開源軟件庫,最近推出了多項功能,可提高性能并支持 DALI 的新用例。
2 MIN READ