Boxiang Wang

Boxiang Wang 是 NVIDIA 的深度學習算法工程師,專門從事大規模大語言模型 (LLM) 訓練。他為 NVIDIA NeMo 框架和 Megatron-Core 做出了貢獻,專注于長上下文 LLM 訓練、先進的模型架構和高級模型并行技術。此前,他是 ColossalAI 的創始工程師和研究員。他擁有南洋理工大學工程學士學位和哈佛大學計算科學與工程碩士學位。

Posts by Boxiang Wang

對話式人工智能

通過高效的長上下文大語言模型訓練擴展到數百萬個 Token

大語言模型 (LLM) 的演變標志著其處理和生成文本的能力有了顯著提升。在這些發展中,上下文長度的概念 (模型可以處理的單個輸入樣本中的… 2 MIN READ