康暉 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 19 Jun 2025 05:31:31 +0000 zh-CN hourly 1 196178272 NVIDIA recsys-examples: 生成式推薦系統大規模訓練推理的高效實踐(上篇) http://www.open-lab.net/zh-cn/blog/nvidia-recsys-generative-recommenders-1/ Thu, 19 Jun 2025 04:40:47 +0000 http://www.open-lab.net/zh-cn/blog/?p=14326 Continued]]> 在生成式 AI 浪潮的推動下,推薦系統領域正經歷深刻變革。傳統的深度學習推薦模型(DLRMs)雖已展現出一定效果,但在捕捉用戶興趣偏好和動態行為序列變化時,常面臨可擴展性挑戰。生成式推薦系統(Generative Recommenders, GRs)的出現,為這一領域帶來了全新思路與機遇。本文將介紹 NVIDIA recsys-examples 中針對生成式推薦場景設計的高效實踐參考。博客內容共分為上下兩篇,本篇將整體介紹 recsys-examples 的設計和功能,下篇將對核心模塊進行深入的解析。 GitHub repo: https://github.com/NVIDIA/recsys-examples Meta Research 的最新研究表明,生成式推薦系統通過將推薦問題重構為生成式建模框架下的序列 transduction 任務,展現出顯著優勢:

Source

]]>
14326
借助最新 NVIDIA Merlin TensorFlow 插件實現大規模 Embedding 擴展 http://www.open-lab.net/zh-cn/blog/merlin-tensorflow-plugin-embedding-extension/ Wed, 24 Jul 2024 04:33:58 +0000 http://www.open-lab.net/zh-cn/blog/?p=10688 Continued]]> 通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得 TensorFlow用戶可以借助 HugeCTR 的一些相關特性和優化加速 GPU 上的分布式 Embedding訓練。 在以往文章中(Merlin HugeCTR Sparse Operation Kit 系列之一 – NVIDIA 技術博客, Merlin HugeCTR Sparse Operation Kit 系列之二 – NVIDIA 技術博客),我們對 HugeCTR SOK 的基本功能、性能、用法和原理做了詳細的介紹。近期 SOK 又發布了多個版本迭代,這篇博客對最新 v2.0 版本中的新特性 (尤其是動態Embedding 和在線訓練增量導出),用法進行了歸納總結和介紹,并在最后介紹了 SOK 在手機行業的應用案例。 圖 1.

Source

]]>
10688
人人超碰97caoporen国产