Anton Korzh

Anton Korzh 是 NVIDIA 高級深度學習研究 (ADLR) 團隊的首席深度學習架構師。他熱衷于突破大規模 AI 工作負載的通信性能和可擴展性極限,在分布式高性能計算方面擁有 20 年的經驗。Anton 擁有莫斯科州立大學計算機科學博士學位。

Posts by Anton Korzh

生成式人工智能/大語言模型

NVSwitch 和 TensorRT-LLM MultiShot 共同加速 AllReduce 速度達 3 倍

在用戶數量可能在數百到數十萬之間波動,且輸入序列長度隨每個請求而變化的生產環境中,部署生成式 AI 工作負載會面臨獨特的挑戰。 1 MIN READ