作為人工智能創新的前沿, NVIDIA 繼續推進機器學習、自動駕駛汽車、機器人、圖形等領域的技術邊界。 NVIDIA 研究人員將在 12 月 6 日至 2021 年 12 月 14 日的第三十五屆神經信息處理系統年會上發表 20 篇論文。
以下是一些特色報紙:
無別名生成對抗網絡( StyleGAN3 )
特羅·卡拉斯、米基卡·艾塔拉、薩穆利·萊恩、埃里克·弗羅斯頓、詹恩·赫爾斯滕、雅科·萊赫蒂寧、蒂莫·艾拉{124; Paper [1246] GitHub [1247]
NVIDIA Research 開發的 StyleGAN3 模型推動了生成性對抗網絡合成真實圖像的最新技術。這一突破將信號處理和圖像處理中的圖形原理引入 GANs ,以避免混疊:當圖像旋轉、縮放或平移時,通常會看到一種圖像損壞。論文將于 12 月 7 日星期二上午 12:40 – 12:55 (太平洋標準時間)提交。
EditGAN :高精度語義圖像編輯
Huan Ling*、Karsten Kreis*、李戴青、金承旭、安東尼奧·托拉巴、Sanja Fidler。
Edigan ,一種用于高質量、高精度語義圖像編輯的新方法,允許用戶通過修改其高度詳細的零件分割遮罩來編輯圖像,例如,為汽車前照燈繪制新遮罩。 EditGAN 建立在 GAN 框架的基礎上,該框架可以對圖像及其語義分段進行聯合建模,只需要少量標記的示例,使其成為可擴展的編輯工具。海報會議將于 12 月 9 日星期四上午 8:30 –上午 10:00 (太平洋標準時間)舉行。
SegFormer :使用 Transformer 進行語義切分的簡單高效設計
謝恩澤、王文海、余志定、阿尼瑪·阿南德庫馬爾、何塞· M ·阿爾瓦雷斯、羅平| Paper | GitHub
SegFormer 是一個簡單、高效但功能強大的語義分割框架,它將 Transformer 與輕量級多層感知( MLP )解碼器結合起來。 SegFormer 有兩個吸引人的特性: 1 ) SegFormer 包含一個新穎的分層結構 transformer 編碼器,可輸出多尺度特性。它不需要位置編碼,從而避免了當測試分辨率不同于訓練時位置代碼的插值,從而導致性能下降。 2 ) SegFormer 避免了復雜的解碼器。海報將于太平洋標準時間 12 月 7 日星期二上午 8:30-10:00 發布。
視頻 3 。視頻顯示了 SegFormer 在 Cityscapes-C 數據集上出色的零鏡頭魯棒性。
DIB-R ++:學習使用混合微分渲染器預測照明和材質
陳文正、喬伊·利塔連、高軍、王子安、曾福吉、薩梅·哈米斯或利塔尼、桑加·菲德勒 Paper
DIB-R ++,一種延遲的、基于圖像的渲染器,通過結合光柵化和光線跟蹤,利用它們各自的優勢、速度和真實感,支持這些照片級真實感效果。海報發布時間為太平洋標準時間 12 月 9 日星期四下午 4:30 – 6:00 。
除了 NoRIP 2021 美國在線的論文外,研究人員和開發人員還可以利用新的高嶺土特征加速 3D 深度學習。
Kaolin 正在推出新功能以加速 3D 深度學習研究。 NVIDIA Omniverse Kaolin 應用程序的更新將為大量點云帶來強大的可視化效果。 Kaolin 庫的更新將包括對四面體網格的支持、光線管理功能以及對 DIB-R 的強大加速。要了解更多有關 Kaolin 的信息,請參閱最近的 GTC 課程。
要查看 NVIDIA Research 接受論文、研討會和教程、演示的完整列表,并探索 NVIDIA 的就業機會,請訪問 NVIDIA 和 NeurIPS 2021 網站。