Posts by Gomathy Venkata Krishnan
數據中心/云端
2025年 2月 12日
使用 NVIDIA NeMo 框架進行 LLM 模型剪枝和知識蒸餾
模型剪枝和知識蒸餾是功能強大且經濟高效的策略,用于從最初較大的同級獲得較小的語言模型。 在一篇“ 如何剪枝和蒸餾 Llama-3.1 8B ”…
4 MIN READ