Posts by Terry Kong
生成式人工智能/大語言模型
2024年 12月 17日
利用 NVIDIA NeMo-Aligner 進行監督式微調的數據高效知識蒸餾
知識蒸餾是一種將更大的教師模型的知識轉移到更小的學生模型的方法,理想情況下可生成緊湊、易于部署的學生,且準確度與教師相當。
2 MIN READ