Posts by Arham Mehta
數據科學
2025年 5月 7日
使用 NVIDIA NeMo Curator 構建 Nemotron-CC:一個高質量萬億令牌數據集,用于大型語言模型預訓練,源自 Common Crawl
對于想要訓練先進的 大語言模型 (LLM) 的企業開發者而言,整理高質量的預訓練數據集至關重要。為了讓開發者能夠構建高度準確的 LLM,
2 MIN READ
生成式人工智能/大語言模型
2024年 7月 10日
利用 NVIDIA NeMo Curator 整理非英語數據集以訓練 LLM
數據管護在開發有效且公平的大型語言模型(LLMs)方面發揮著至關重要的作用。高質量、多樣化的訓練數據直接影響 LLMs 的性能,從而解決偏差、
3 MIN READ
數據科學
2024年 5月 21日
利用 NVIDIA NeMo Curator 為 LLM 訓練整理自定義數據集
數據管護是預訓練和持續訓練模型的第一步,也可以說是最重要的一步,對于 大型語言模型 (LLM) 和小型語言模型 (SLM) 都至關重要。
3 MIN READ