Mehran Maghoumi

Mehran Maghoumi 是 NVIDIA 的高級深度學習開發者倡導者,專注于生成式 AI 和 NeMo 框架生態系統。在此之前,他是 NVIDIA 的高級深度學習工程師,專注于 NVIDIA DRIVE 平臺環繞攝像頭系統中的停車空間感知。他擁有中佛羅里達大學計算機科學博士學位。

Posts by Mehran Maghoumi

生成式人工智能/大語言模型

使用 DeepSeek-R1 NIM 構建具有專家推理功能的 AI 智能體

AI 智能體 正在通過實現流程自動化、優化決策制定和簡化操作來改變業務運營。其有效性取決于專家推理,從而實現更明智的規劃和高效執行。 2 MIN READ
數據科學

借助 NVIDIA NeMo Curator 簡化域自適應預訓練的數據處理

大語言模型(LLMs)的領域自適應預訓練(DAPT)是構建特定領域模型的重要步驟。與現成的開放或商用模型相比, 6 MIN READ
數據科學

利用 NVIDIA NeMo Curator 整理用于 LLM 參數高效微調的自定義數據集

在最近的一篇博文中,我們討論了如何使用 NVIDIA NeMo Curator 整理自定義數據集, 3 MIN READ
數據科學

利用 NVIDIA NeMo Curator 為 LLM 訓練整理自定義數據集

數據管護是預訓練和持續訓練模型的第一步,也可以說是最重要的一步,對于 大型語言模型 (LLM) 和小型語言模型 (SLM) 都至關重要。 3 MIN READ
數據科學

借助 NVIDIA NeMo Curator 擴展和整理用于 LLM 訓練的高質量數據集

大型語言模型 (LLM) 是提高運營效率和推動創新的強大工具。NVIDIA NeMo 微服務 旨在簡化構建和部署模型的流程。 1 MIN READ