Posts by Erin Ho
數據中心/云端
2025年 3月 18日
NVIDIA Blackwell 實現世界紀錄的 DeepSeek-R1 推理性能
NVIDIA 在 NVIDIA GTC 2025 上宣布了創下世界紀錄的 DeepSeek-R1 推理性能 。 搭載 8 個 NVIDIA…
5 MIN READ
對話式人工智能
2024年 8月 15日
NVIDIA TensorRT 模型優化器 v0.15 提高推理性能擴展模型支持能力
NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型優化器,這是一種先進的模型優化技術量化工具包,包含量化、
2 MIN READ
對話式人工智能
2024年 7月 12日
利用新的 NVIDIA Megatron-Core 功能高效訓練生成式 AI 模型
NVIDIA Megatron-LM 于 2019 年首次推出,在 AI 社區引發了一波創新浪潮,
3 MIN READ
生成式人工智能/大語言模型
2024年 5月 8日
NVIDIA TensorRT 模型優化器加速生成人工智能推理性能,現已公開
在快速發展的環境中,生成人工智能的發展對加速推理速度的需求仍然是一個緊迫的問題。隨著模型規模和復雜性的指數級增長,
3 MIN READ
生成式人工智能/大語言模型
2024年 3月 7日
NVIDIA TensorRT 通過 8 位預訓練量化將 Stable Diffusion 的速度提升近 2 倍
在生成式 AI 的動態領域,擴散模型脫穎而出,成為使用文本提示生成高質量圖像的功能強大的架構 .
3 MIN READ