Min-Hung Chen

Min-Hung (Steve) Chen 是臺灣 NVIDIA 研究院的高級研究科學家,從事視覺+X 多模態 AI 研究。他于 2020 年獲得佐治亞理工學院博士學位。Min - Hung 的主要研究興趣是多模態 AI,包括視覺語言、視頻理解、跨模態學習、高效調優和 Transformer.他還對完全監督之外的學習感興趣,包括領域適應、遷移學習、X 監督學習等。

Posts by Min-Hung Chen

數據中心/云端

借助 EoRA 快速恢復 LLM 壓縮錯誤的免微調方法

模型壓縮技術已經過廣泛探索,可減少為大語言模型 (LLM) 或其他大型神經網絡提供服務所需的計算資源。 但是,與未壓縮的模型相比, 5 MIN READ
計算機視覺/視頻分析

推出高性能微調解決方案 DoRA,LoRA 的替代選擇

全微調(FT)通常用于針對特定的下游任務定制通用預訓練模型。為了降低訓練成本,我們引入了參數高效微調(PEFT)方法, 3 MIN READ