Shelby Thomas

Shelby 是 NVIDIA 在 DGX 云中訓練可靠性的產品負責人。在加入 NVIDIA 之前,他曾在 OctoAI 從事跨各種硬件平臺加速 ML 模型部署的工作,并在 Google 開發了深度學習模型。他擁有加州大學圣地亞哥分校的計算機科學博士學位。

Posts by Shelby Thomas

AI 平臺/部署

在 NVIDIA DGX 云上確保模型訓練可靠性

在大型 GPU 集群上訓練 AI 模型給模型構建者帶來了重大挑戰。隨著作業規模的增加,人工干預變得不切實際, 1 MIN READ