趙紅博

河南科技大學機械制造專業,擁有工學學士學位,目前在 Boss 直聘擔任高性能計算開發工程師,主要研究招聘領域模型的推理加速工作。

Posts by 趙紅博

人工智能/深度學習

如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型

大型語言模型正以其驚人的新能力推動人工智能的發展,擴大其應用范圍。然而,由于這類模型具有龐大的參數規模,部署和推理的難度和成本極高, 2 MIN READ