Hopper

2025年 5月 1日
借助 NVIDIA cuBLAS 12.9 提高矩陣乘法速度和靈活性
NVIDIA CUDA-X 數學庫助力開發者為 AI、科學計算、數據處理等領域構建加速應用。
3 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍
在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下, 大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時,
3 MIN READ

2025年 3月 3日
AI 模型為環保人士提供大規模保護漁業和野生動物的新工具
為了遏制非法捕撈,研究人員發布了一個新的開源 AI 模型,該模型可以準確識別世界上幾乎所有的航海船只的行為,包括船只是否可能非法捕撈。
1 MIN READ

2025年 2月 28日
聚焦:NAVER Place 利用 NVIDIA TensorRT-LLM 優化 SLM 基礎的垂直服務
NAVER 是一家韓國熱門搜索引擎公司,提供 Naver Place ,這是一項基于地理的服務,可提供有關韓國數百萬家企業和興趣點的詳細信息。
4 MIN READ

2025年 2月 28日
使用 DeepSeek-R1 NIM 構建具有專家推理功能的 AI 智能體
AI 智能體 正在通過實現流程自動化、優化決策制定和簡化操作來改變業務運營。其有效性取決于專家推理,從而實現更明智的規劃和高效執行。
2 MIN READ

2025年 2月 20日
聚焦:東京大學使用 NVIDIA Grace Hopper 進行開創性的節能地震研究
超級計算機是推動突破性發現的引擎。從預測極端天氣到推進疾病研究,以及設計更安全、更高效的基礎設施,這些機器可以模擬因規模、
2 MIN READ

2025年 2月 13日
使用 DeepSeek-R1 和推理時間縮放實現自動化 GPU 內核生成
隨著 AI 模型擴展其功能以解決更復雜的挑戰,一種稱為“ 測試時擴展 ”或“ 推理時擴展 ”的新擴展法則正在出現。
2 MIN READ

2025年 2月 10日
NVIDIA Grace CPU 與 Arm 軟件生態系統集成
NVIDIA Grace CPU 將節能高效的性能提升到了新的高度,正在改變數據中心的設計。Grace CPU 專為數據中心規模打造,
2 MIN READ

2025年 2月 5日
NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可編程性
矩陣乘法和注意力機制是現代 AI 工作負載的計算支柱。雖然庫如 NVIDIA cuDNN 提供高度優化的實現,
2 MIN READ

2025年 2月 4日
新的 AI 模型提供癌癥細胞級視圖
研究癌癥的研究人員推出了一種新的 AI 模型,該模型提供了癌細胞的細胞級映射和可視化,
1 MIN READ

2025年 1月 31日
CUDA 工具包現已支持 NVIDIA Blackwell 架構
CUDA 工具包 的最新版本 (版本 12.8) 使用最新的 NVIDIA CPU 和 GPU,持續提升數據科學、AI、
3 MIN READ

2024年 12月 16日
2024 年熱門文章:NVIDIA NIM、語言模型突破和數據科學優化的精要
對于使用 NVIDIA 技術的開發者、研究人員和創新者來說,2024 年又是具有里程碑意義的一年。
2 MIN READ

2024年 11月 19日
Llama 3.2 全棧優化釋放 NVIDIA GPU 的高性能
Meta 最近發布了 Llama 3.2 系列視覺語言模型(VLM),其中包含 11B 參數和 90B 參數變體。這些模型是多模態模型,
2 MIN READ

2024年 11月 19日
NVIDIA cuDSS 庫推動美國電網優化無障礙發展
隨著電力需求不斷增長,電網的電力系統優化(PSO)對于確保高效的資源管理、可持續性和能源安全至關重要。 東部互聯是北美的主要電網,
2 MIN READ

2024年 11月 14日
探索采用自主 AI 和 NVIDIA 機密計算的超級協議案例
機密和自主的 AI 是一種新的 AI 開發、訓練和推理方法,其中用戶的數據是去中心化的、私有的,并由用戶自己控制。
3 MIN READ

2024年 11月 11日
使用 NVIDIA Megatron-LM 構建強大日語能力的 1720 億語言模型
生成式 AI 具有創建全新內容的能力,這是傳統機器學習(ML)方法難以實現的。在自然語言處理(NLP)領域, 大型語言模型(LLMs)…
2 MIN READ