Selvaraj Anandaraj

Selvaraj Anandaraj 是一名深度學習性能工程師,致力于使用 NVIDIA 硬件和軟件堆棧加速深度學習工作負載。他最近的工作重點是擁有一個高性能的軟件堆棧來大規模訓練和推理大語言模型。他擁有威斯康星大學麥迪遜分校的機器學習系統專業碩士學位。

Posts by Selvaraj Anandaraj

數據中心/云端

借助 NVIDIA Nemo 框架,在遠程數據中心網絡中加速 LLM 訓練

多數據中心訓練對 AI 工廠至關重要,因為預訓練擴展會推動更大模型的創建,導致對計算性能的需求超過單個設施的能力。 2 MIN READ