Posts by 金國強
模型/庫/框架
2025年 6月 26日
在魔搭社區使用 NVIDIA TensorRT-LLM PyTorch 新架構優化 Qwen3 系列模型推理
摘要: TensorRT-LLM 采用 PyTorch 全新架構進一步優化模型部署流程,提升開發者使用體驗。
2 MIN READ
生成式人工智能/大語言模型
2025年 5月 30日
在阿里云 PAI 上一鍵部署和使用 NVIDIA Cosmos Reason-1 模型
NVIDIA 近期發布了 Cosmos Reason-1 的 7B 和 56B 兩款多模態大語言模型 (MLLM),它們經過了“物理 AI…
3 MIN READ
Uncategorized
2024年 9月 2日
使用 NVIDIA NIM 在阿里云容器服務(ACK)中加速 LLM 推理
大語言模型(LLM)是近年來發展迅猛并且激動人心的熱點話題,引入了許多新場景,滿足了各行各業的需求。隨著開源模型能力的不斷增強,
4 MIN READ