Posts by Mehran Maghoumi
生成式人工智能/大語言模型
2025年 2月 28日
使用 DeepSeek-R1 NIM 構建具有專家推理功能的 AI 智能體
AI 智能體 正在通過實現流程自動化、優化決策制定和簡化操作來改變業務運營。其有效性取決于專家推理,從而實現更明智的規劃和高效執行。
2 MIN READ
數據科學
2024年 9月 10日
借助 NVIDIA NeMo Curator 簡化域自適應預訓練的數據處理
大語言模型(LLMs)的領域自適應預訓練(DAPT)是構建特定領域模型的重要步驟。與現成的開放或商用模型相比,
6 MIN READ
數據科學
2024年 7月 31日
利用 NVIDIA NeMo Curator 整理用于 LLM 參數高效微調的自定義數據集
在最近的一篇博文中,我們討論了如何使用 NVIDIA NeMo Curator 整理自定義數據集,
3 MIN READ
數據科學
2024年 5月 21日
利用 NVIDIA NeMo Curator 為 LLM 訓練整理自定義數據集
數據管護是預訓練和持續訓練模型的第一步,也可以說是最重要的一步,對于 大型語言模型 (LLM) 和小型語言模型 (SLM) 都至關重要。
3 MIN READ
數據科學
2024年 3月 27日
借助 NVIDIA NeMo Curator 擴展和整理用于 LLM 訓練的高質量數據集
大型語言模型 (LLM) 是提高運營效率和推動創新的強大工具。NVIDIA NeMo 微服務 旨在簡化構建和部署模型的流程。
1 MIN READ