Posts by Janaki Vamaraju
數據科學
2025年 5月 7日
使用 NVIDIA NeMo Curator 構建 Nemotron-CC:一個高質量萬億令牌數據集,用于大型語言模型預訓練,源自 Common Crawl
對于想要訓練先進的 大語言模型 (LLM) 的企業開發者而言,整理高質量的預訓練數據集至關重要。為了讓開發者能夠構建高度準確的 LLM,
2 MIN READ
生成式人工智能/大語言模型
2024年 10月 10日
NVIDIA NIM 微服務助力電信 O-RAN 規范高級 RAG 技術實現
移動通信標準通過協調技術協議來促進不同供應商的網絡和設備之間的互操作性,在電信生態系統中發揮著至關重要的作用。隨著這些標準的發展,
2 MIN READ
數據科學
2024年 9月 10日
借助 NVIDIA NeMo Curator 簡化域自適應預訓練的數據處理
大語言模型(LLMs)的領域自適應預訓練(DAPT)是構建特定領域模型的重要步驟。與現成的開放或商用模型相比,
6 MIN READ