Gerald Shen

Gerald Shen 是 NVIDIA 的深度學習算法工程師,專門從事模型對齊。他領導了 NeMo Aligner 工具包的開發,這是一個可擴展的工具包,用于對齊大型語言模型。該工具包已用于將 NVIDIA 的模型與算法(如從人類反饋中進行強化學習(RLHF))相匹配。

Posts by Gerald Shen

內容創建/渲染

使用 DRaFT+增強文本到圖像的微調,現已是 NVIDIA NeMo 的一部分

文本到圖像的 Diffusion 模型已經被建立為基于給定文本的高保真圖像生成的強大方法。然而, 3 MIN READ