TensorRT

2024年 7月 24日

借助最新 NVIDIA Merlin TensorFlow 插件實現大規模 Embedding 擴展

通過封裝 NVIDIA Merlin HugeCTR，Sparse Operation Kit（以下簡稱 SOK）使得…

4 MIN READ

2024年 6月 11日

借助 NVIDIA TensorRT 輕量級引擎，為 AI 應用提供卓越性能和最小占用空間

NVIDIA TensorRT一個成熟的數據中心推理庫，已迅速成為 NVIDIA GeForce RTX 和 NVIDIA RTX GPU…

2 MIN READ

2024年 6月 3日

NVIDIA 與 Hugging Face 合作，簡化生成式 AI 模型部署

隨著生成式 AI 的快速增長，社區通過兩種重要方式加強了這種擴展：快速發布先進的基礎模型，以及簡化其與應用程序開發和生產的集成。

2 MIN READ

2024年 6月 2日

借助適用于 Windows RTX PC 的 NVIDIA RTX AI 工具包，簡化 AI 驅動型應用的開發

NVIDIA 今日發布了 NVIDIA RTX AI 工具包，這是一個工具和 SDK 集合，

2 MIN READ

2024年 5月 30日

借助 Gipi、 NVIDIA TensortRT-LLM 和 AI 基礎模型實現個性化學習

超過 1.2 億人正在積極學習新語言，而 5 億學習者正在數字學習平臺（如 Duolingo）上學習。與此同時，全球很大一部分人口，

2 MIN READ

2024年 5月 14日

NVIDIA TensorRT 10.0 升級可用性、性能和 AI 模型支持

NVIDIA 今天宣布最新發布的 NVIDIA TensorRT，一個用于高性能深度學習推理的 API 生態系統。

2 MIN READ

2024年 5月 8日

NVIDIA TensorRT 模型優化器加速生成人工智能推理性能，現已公開

在快速發展的環境中，生成人工智能的發展對加速推理速度的需求仍然是一個緊迫的問題。隨著模型規模和復雜性的指數級增長，

3 MIN READ

2024年 4月 2日

使用 NVIDIA TensorRT-LLM 調整和部署 LoRA LLM

大型語言模型 (LLM) 可以從大量文本中學習，并為各種任務和領域生成流暢、一致的文本，從而徹底改變自然語言處理 (NLP)。然而，

7 MIN READ

2024年 3月 19日

FP8：前沿精度與性能的新篇章

在深度學習和人工智能的快速發展背景下，尤其是大語言模型（Large Language Model, LLM）的蓬勃發展，

3 MIN READ

2024年 3月 18日

借助 NVIDIA NeMo Retriever，將企業數據轉換為可行見解

在每個行業和每個工作職能部門，生成式 AI 正在激發組織內部的潛力，它將數據轉化為知識，并使員工能夠更高效地工作。

2 MIN READ

2024年 3月 7日

在 NVIDIA AI 推理平臺上使用 Stable Diffusion XL 生成令人驚嘆的圖像

擴散模型正在各行各業中改變創意工作流程。這些模型通過采用降噪擴散技術，將隨機噪聲逐步塑造為 AI 生成的藝術，

4 MIN READ

2024年 3月 7日

NVIDIA TensorRT 通過 8 位預訓練量化將 Stable Diffusion 的速度提升近 2 倍

在生成式 AI 的動態領域，擴散模型脫穎而出，成為使用文本提示生成高質量圖像的功能強大的架構 .

3 MIN READ

2024年 2月 1日

借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 部署 AI 編碼助手

大型語言模型 (LLM) 的出現革新了人工智能領域，為與數字世界的交互提供了全新的方式。盡管 LLM 通常能夠提供良好的通用解決方案，

4 MIN READ

2024年 1月 29日

使用全卷積網絡在 Transformer 模型中模擬注意力機制

在過去十年中，深度學習技術在計算機視覺 (CV) 任務中的應用大幅增加。卷積神經網絡 (CNN) 一直是這場革命的基石，展示了卓越的性能，

3 MIN READ

2024年 1月 16日

強大的場景文本檢測和識別：簡介

識別和識別自然場景和圖像中的文本對于視頻標題文本識別、檢測車載攝像頭的標牌、信息檢索、場景理解、車牌識別以及識別產品文本等用例變得非常重要。

1 MIN READ

2024年 1月 16日

強大的場景文本檢測和識別：實施

要使場景文本檢測和識別適用于不規則文本或特定用例，您必須完全控制模型，以便根據用例和數據集執行增量學習或微調。請記住，此工作流是場景理解、

2 MIN READ