Hao Wu

Hao Wu 是 NVIDIA 的高級 GPU 計算架構師。他在完成博士學位后于 2011 年加入 NVIDIA 計算架構組。在中國科學院。近年來, Hao 的技術重點是將低精度應用于深度神經網絡訓練和推理。

Posts by Hao Wu

數據中心/云端

借助 NVIDIA Nemo 框架,在遠程數據中心網絡中加速 LLM 訓練

多數據中心訓練對 AI 工廠至關重要,因為預訓練擴展會推動更大模型的創建,導致對計算性能的需求超過單個設施的能力。 2 MIN READ
數據科學

NVIDIA Merlin Distributed-Embeddings輕松快速訓練TB 級推薦模型

Embedding在深度學習推薦模型中起著關鍵作用。它們被用于將輸入數據中的離散特征映射到向量,以便下游的神經網絡進行處理。 3 MIN READ
人工智能/深度學習

利用 NVIDIA TensorRT 量化感知訓練實現 INT8 推理的 FP32 精度

深度學習正在徹底改變行業提供產品和服務的方式。這些服務包括用于計算機視覺的對象檢測、分類和分割,以及用于基于語言的應用程序的文本提取、 5 MIN READ