Models / Libraries / Frameworks

2025年 7月 7日
提出一個維基百科規模的問題:如何利用數百萬 token 的實時推理使世界更加智能
現代 AI 應用越來越依賴于將龐大的參數數量與數百萬個令牌的上下文窗口相結合的模型。無論是經過數月對話的 AI 智能體、
3 MIN READ

2025年 7月 1日
適用于有效 FP8 訓練的按張量和按塊擴展策略
在本博文中,我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…
2 MIN READ

2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上運行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 現已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上個月,
1 MIN READ

2025年 6月 18日
NVIDIA 在制造和運營領域的 AI 應用:借助 NVIDIA CUDA-X 數據科學加速 ML 模型
從晶圓制造和電路探測到封裝芯片測試,NVIDIA 利用數據科學和機器學習來優化芯片制造和運營工作流程。這些階段會產生 TB 級的數據,
3 MIN READ

2025年 6月 18日
搶先體驗 NVIDIA GB200 系統如何幫助 LMarena 構建評估 LLM 的模型
在 NVIDIA 和 Nebius 的幫助下,加州大學伯克利分校的 LMArena 可以更輕松地了解哪些大語言模型在特定任務中表現出色。
2 MIN READ

2025年 6月 18日
借助 NVIDIA NIM 推理微服務和 ITMonitron 實現實時 IT 事故檢測和情報
在當今快節奏的 IT 環境中,并非所有事件都始于明顯的警報。這些問題可能始于細微的分散信號、錯過的警報、悄無聲息的 SLO 漏洞,
2 MIN READ

2025年 6月 13日
使用 FlashInfer 運行 NVIDIA 的高性能 LLM 推理內核
出色的 LLM 推理需要兩個關鍵要素:速度和開發者速度。速度是指通過使用高度優化的計算內核算法,最大限度地提高底層硬件的效率。
2 MIN READ

2025年 6月 12日
借助 MMseqs2-GPU 和 NVIDIA NIM 加速蛋白質科學序列對齊
蛋白質序列對齊 (比較蛋白質序列的相似性) 是現代生物學和醫學的基礎。它通過重建進化關系 (技術上稱為 homology…
3 MIN READ

2025年 6月 11日
使用 NVIDIA Cosmos Predict-2 構建自定義物理人工智能基礎模型
構建更智能的機器人和自動駕駛汽車 (AV) 始于能夠理解現實世界動態的物理 AI 模型。這些模型發揮著兩個關鍵作用:
2 MIN READ

2025年 6月 11日
使用開源 NVIDIA cuOpt 加速決策優化
企業每天都會做出成千上萬的決策,包括生產什么、在哪里發貨、如何分配資源。大規模優化這些決策成為一項計算挑戰。線性規劃 (LP) 、
2 MIN READ

2025年 6月 11日
借助統一的 NVIDIA NIM 工作流簡化 LLM 部署和 AI 推理
將大語言模型 (LLM) 集成到真實用戶與之大規模交互的生產環境中,是任何 AI 工作流中最重要的部分。這不僅僅是讓模型運行,
3 MIN READ

2025年 6月 11日
借助神經重建和世界基礎模型提升自動駕駛汽車仿真速度
自動駕駛汽車 (AV) 堆棧正在從離散構建塊的層次結構發展為基于foundation models構建的端到端架構。
1 MIN READ

2025年 6月 11日
借助 NVIDIA 生物醫學 AI-Q 研究代理 Blueprint 推進文獻回顧和目標發現
長期以來,生物醫學研究和藥物研發一直受到勞動密集型流程的限制。為了發起藥物研發活動,研究人員通常會梳理大量科學論文,
1 MIN READ

2025年 6月 11日
借助 NVIDIA cuEquivariance 和 NVIDIA NIM 微服務加速分子建模
隨著 AlphaFold2 等模型的出現,對加速推理和訓練分子 AI 模型的需求激增。對速度的需求帶來了獨特的計算挑戰,包括算法復雜性、
2 MIN READ

2025年 6月 5日
利用 NVIDIA cuML 中的森林推理庫加速樹模型推理
樹集成模型仍然是表格數據的首選,因為它們準確、訓練成本相對較低且速度快。但是,如果您需要低于 10 毫秒的延遲或每秒數百萬次的預測,
3 MIN READ

2025年 6月 4日
NVIDIA 語音 AI 模型實現業界領先的準確性和性能
NVIDIA 正在推動語音 AI 和語言模型實現出色的性能、效率和可訪問性,為重新定義自動語音識別 (ASR) 可能性的創新奠定基礎。
2 MIN READ