TensorRT

2024年 7月 24日
借助最新 NVIDIA Merlin TensorFlow 插件實現大規模 Embedding 擴展
通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得…
4 MIN READ

2024年 6月 11日
借助 NVIDIA TensorRT 輕量級引擎,為 AI 應用提供卓越性能和最小占用空間
NVIDIA TensorRT一個成熟的數據中心推理庫,已迅速成為 NVIDIA GeForce RTX 和 NVIDIA RTX GPU…
2 MIN READ

2024年 6月 3日
NVIDIA 與 Hugging Face 合作,簡化生成式 AI 模型部署
隨著生成式 AI 的快速增長,社區通過兩種重要方式加強了這種擴展:快速發布先進的基礎模型,以及簡化其與應用程序開發和生產的集成。
2 MIN READ

2024年 6月 2日
借助適用于 Windows RTX PC 的 NVIDIA RTX AI 工具包,簡化 AI 驅動型應用的開發
NVIDIA 今日發布了 NVIDIA RTX AI 工具包,這是一個工具和 SDK 集合,
2 MIN READ

2024年 5月 30日
借助 Gipi、 NVIDIA TensortRT-LLM 和 AI 基礎模型實現個性化學習
超過 1.2 億人 正在積極學習新語言,而 5 億學習者 正在數字學習平臺(如 Duolingo)上學習。與此同時,全球很大一部分人口,
2 MIN READ

2024年 5月 14日
NVIDIA TensorRT 10.0 升級可用性、性能和 AI 模型支持
NVIDIA 今天宣布最新發布的 NVIDIA TensorRT,一個用于高性能深度學習推理的 API 生態系統。
2 MIN READ

2024年 5月 8日
NVIDIA TensorRT 模型優化器加速生成人工智能推理性能,現已公開
在快速發展的環境中,生成人工智能的發展對加速推理速度的需求仍然是一個緊迫的問題。隨著模型規模和復雜性的指數級增長,
3 MIN READ

2024年 4月 2日
使用 NVIDIA TensorRT-LLM 調整和部署 LoRA LLM
大型語言模型 (LLM) 可以從大量文本中學習,并為各種任務和領域生成流暢、一致的文本,從而徹底改變自然語言處理 (NLP)。然而,
7 MIN READ

2024年 3月 19日
FP8:前沿精度與性能的新篇章
在深度學習和人工智能的快速發展背景下,尤其是大語言模型(Large Language Model, LLM)的蓬勃發展,
3 MIN READ

2024年 3月 18日
借助 NVIDIA NeMo Retriever,將企業數據轉換為可行見解
在每個行業和每個工作職能部門,生成式 AI 正在激發組織內部的潛力,它將數據轉化為知識,并使員工能夠更高效地工作。
2 MIN READ

2024年 3月 7日
在 NVIDIA AI 推理平臺上使用 Stable Diffusion XL 生成令人驚嘆的圖像
擴散模型正在各行各業中改變創意工作流程。這些模型通過采用降噪擴散技術,將隨機噪聲逐步塑造為 AI 生成的藝術,
4 MIN READ

2024年 3月 7日
NVIDIA TensorRT 通過 8 位預訓練量化將 Stable Diffusion 的速度提升近 2 倍
在生成式 AI 的動態領域,擴散模型脫穎而出,成為使用文本提示生成高質量圖像的功能強大的架構 .
3 MIN READ

2024年 2月 1日
借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 部署 AI 編碼助手
大型語言模型 (LLM) 的出現革新了人工智能領域,為與數字世界的交互提供了全新的方式。盡管 LLM 通常能夠提供良好的通用解決方案,
4 MIN READ

2024年 1月 29日
使用全卷積網絡在 Transformer 模型中模擬注意力機制
在過去十年中,深度學習技術在計算機視覺 (CV) 任務中的應用大幅增加。卷積神經網絡 (CNN) 一直是這場革命的基石,展示了卓越的性能,
3 MIN READ

2024年 1月 16日
強大的場景文本檢測和識別:簡介
識別和識別自然場景和圖像中的文本對于視頻標題文本識別、檢測車載攝像頭的標牌、信息檢索、場景理解、車牌識別以及識別產品文本等用例變得非常重要。
1 MIN READ

2024年 1月 16日
強大的場景文本檢測和識別:實施
要使場景文本檢測和識別適用于不規則文本或特定用例,您必須完全控制模型,以便根據用例和數據集執行增量學習或微調。請記住,此工作流是場景理解、
2 MIN READ