Posts by 劉川
加速計算
2024年 1月 15日
使用 NVIDIA TensorRT-LLM 支持 CodeFuse-CodeLlama-34B 上的 int4 量化和推理優化實踐
Codefuse(https://github.com/codefuse-ai)是由螞蟻集團開發的代碼語言大模型,
3 MIN READ