Terry Kong

Terry Kong 是 NVIDIA 的高級深度學習工程師,從事模型對齊工作,并對基礎架構和深度學習算法的交叉問題感興趣。他獲得了碩士學位。斯坦福大學電氣工程專業。

Posts by Terry Kong

生成式人工智能/大語言模型

利用 NVIDIA NeMo-Aligner 進行監督式微調的數據高效知識蒸餾

知識蒸餾是一種將更大的教師模型的知識轉移到更小的學生模型的方法,理想情況下可生成緊湊、易于部署的學生,且準確度與教師相當。 2 MIN READ