Zijie Yan

Zijie Yan 是 NVIDIA 的一名高級 DevTech 工程師,于 2021 年加入 DevTech 團隊。他專注于提高大型語言模型 (LLM) 訓練系統的效率和可擴展性。目前,Zijie 推動 Megatron-Core 中 MoE 支持的工程計劃,他與團隊密切合作,研究 MoE 訓練系統的工程開發和性能增強。在加入 NVIDIA 之前,Zijie 在孫中山大學的碩士研究期間進行了分布式深度學習通信優化的研究。

Posts by Zijie Yan

對話式人工智能

利用新的 NVIDIA Megatron-Core 功能高效訓練生成式 AI 模型

NVIDIA Megatron-LM 于 2019 年首次推出,在 AI 社區引發了一波創新浪潮, 3 MIN READ