Beginner Technical

2025年 7月 7日
LLM 推理基準測試:使用 TensorRT-LLM 進行性能調優
這是大語言模型延遲 – 吞吐量基準測試系列的第三篇博文,旨在指導開發者如何使用 TensorRT-LLM 對 LLM 推理進行基準測試。
3 MIN READ

2025年 7月 3日
新視頻:使用 NVIDIA Data Flywheel Blueprint 構建可自我提升的 AI 代理
由大語言模型驅動的 AI 智能體正在改變企業工作流,但高昂的推理成本和延遲可能會限制其可擴展性和用戶體驗。為解決這一問題,
1 MIN READ

2025年 7月 2日
NVIDIA Omniverse:開發者需要了解的關于遷移遠離啟動程序的重點
為了繼續努力確保 NVIDIA Omniverse 成為開發者優先平臺,NVIDIA 將于 10 月 1 日棄用 Omniverse…
1 MIN READ

2025年 7月 1日
如何使用 NVIDIA NeMo Agent 工具套件開源庫構建自定義 AI 智能體
AI 智能體通過轉變業務運營、自動執行復雜任務和解鎖新的效率,正在徹底改變數字員工隊伍。借助協作能力,這些智能體現在可以協同工作,
1 MIN READ

2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上運行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 現已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上個月,
1 MIN READ

2025年 6月 24日
NVIDIA Run:ai 和 Amazon SageMaker HyperPod 攜手簡化復雜 AI 訓練管理
NVIDIA Run:ai 和 Amazon Web Services 引入了集成,使開發者能夠無縫擴展和管理復雜的 AI 訓練工作負載。
2 MIN READ

2025年 6月 18日
搶先體驗 NVIDIA GB200 系統如何幫助 LMarena 構建評估 LLM 的模型
在 NVIDIA 和 Nebius 的幫助下,加州大學伯克利分校的 LMArena 可以更輕松地了解哪些大語言模型在特定任務中表現出色。
2 MIN READ

2025年 6月 17日
通過 NVIDIA Holoscan for Media 上的全新 AI 應用實例,實現實時 AI 媒體效果增強
直播媒體工作流越來越多地使用 AI 微服務來增強制作能力。然而,先進的 AI 模型大多托管在云端,由于網絡延遲、帶寬和實時可擴展性方面的限制,
1 MIN READ

2025年 6月 16日
Isaac Sim 和 Isaac Lab 現已推出早期開發者預覽版
NVIDIA 今天發布了 NVIDIA Isaac Sim 和 NVIDIA Isaac Lab 的開發者預覽版…
2 MIN READ

2025年 6月 13日
使用 FlashInfer 運行 NVIDIA 的高性能 LLM 推理內核
出色的 LLM 推理需要兩個關鍵要素:速度和開發者速度。速度是指通過使用高度優化的計算內核算法,最大限度地提高底層硬件的效率。
2 MIN READ

2025年 6月 12日
NVIDIA Holoscan 傳感器橋接技術賦予開發者實時數據處理能力
在快速發展的機器人和邊緣 AI 領域,高效處理和傳輸傳感器數據的能力至關重要。許多邊緣應用正在擺脫單傳感器固定功能解決方案,
3 MIN READ

2025年 6月 12日
使用 NVIDIA Nsight Profiler 簡化 EDF 流體動力學模擬的 GPU 移植
將現有 CPU 應用程序移植到 NVIDIA GPU 可以釋放性能提升,使用戶能夠以更大的規模和更快的速度解決問題。
2 MIN READ

2025年 6月 11日
使用適用于物理 AI 的 NVIDIA NeMo Agent 工具包擴展逼真的機器人仿真
物理 AI 使自主系統 (例如機器人、自動駕駛汽車和智能空間) 能夠在現實世界中智能地感知、理解和行動。但是,
4 MIN READ

2025年 6月 11日
利用 NVIDIA Data Flywheel Blueprint 通過模型蒸餾構建高效的 AI 智能體
隨著企業加速采用代理式 AI,團隊在擴展智能應用程序的同時管理推理成本方面面臨著越來越大的挑戰。大語言模型 (LLM) 提供強大的性能,
2 MIN READ

2025年 6月 11日
使用 Siemens Teamcenter 數字現實查看器打造栩栩如生的數字孿生
現代產品通常由數百萬個部件組成,需要復雜的設計和協作。工業世界在管理復雜性方面面臨重大挑戰,傳統的可視化工具無法渲染這些大型、
1 MIN READ

2025年 6月 11日
通過開源 AI-Q NVIDIA Blueprint 與您的企業數據交流
企業數據呈爆炸式增長,PB 級的電子郵件、報告、Slack 消息和數據庫的堆積速度比任何人都快。市場調研人員 Gartner 表示,
2 MIN READ