DEVELOPER
首頁
博客
論壇
論壇 (英文)
文檔
下載
培訓
Search
Join
deepseek
2025年 3月 7日
基于 1F1B 的 MoE A2A 通信計算 Overlap
在 MoE 模型的訓練過程中,EP rank 之間的 A2A 通信在端到端時間中占據了相當大比重,對訓練效率影響很大,
3 MIN READ
基于 1F1B 的 MoE A2A 通信計算 Overlap
加載更多
人人超碰97caoporen国产
Search
Join
首頁
博客
論壇
論壇 (英文)
文檔
下載
培訓