Gwena Cunha Sergio – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 07 Sep 2023 07:50:47 +0000 zh-CN hourly 1 196178272 在 NVIDIA Jetson Orin 上部署 YOLOv5 與 cuDLA:量化感知訓練到推理 http://www.open-lab.net/zh-cn/blog/deploying-yolov5-on-nvidia-jetson-orin-with-cudla-quantization-aware-training-to-inference/ Thu, 31 Aug 2023 05:36:16 +0000 http://www.open-lab.net/zh-cn/blog/?p=7784 Continued]]> NVIDIA Jetson Orin 是同類中最優秀的人工智能工作負載嵌入式平臺。Orin 平臺的關鍵組件之一是第二代 Deep Learning Accelerator (DLA),這是一個專用的深度學習推理引擎,在 AGX Orin 平臺上提供了三分之一的人工智能計算能力。 這篇文章深入探討了使用 Orin 平臺的嵌入式開發人員如何使用 YOLOv5 作為參考。要了解 DLA 如何幫助最大限度地提高深度學習應用程序的性能的更多信息,請參閱 Maximizing Deep Learning Performance on NVIDIA Jetson Orin with DLA。 YOLOv5 是一種對象檢測算法。在 YOLOv3 和 YOLOv4 的成功基礎上,YOLOv5 旨在提高實時目標檢測任務的準確性和速度。YOLOv5 因其在準確性和速度之間的出色權衡而備受贊譽,

Source

]]>
7784
使用 NVIDIA QAT 工具包為 TensorFlow 和 NVIDIA TensorRT 加速量化網絡 http://www.open-lab.net/zh-cn/blog/accelerating-quantized-networks-with-qat-toolkit-and-tensorrt/ Thu, 16 Jun 2022 02:50:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=4327 Continued]]> 我們很高興宣布 NVIDIA Quantization Aware Training ( QAT ) Toolkit for TensorFlow 2 目標是在 NVIDIA GPU 上使用 NVIDIA TensorRT 加速量化網絡。該工具包為您提供了一個易于使用的 API ,以一種優化的方式量化網絡,只需幾行額外的代碼即可進行 TensorRT 推理。 這篇文章伴隨著 走向 INT8 推理:使用 TensorRT 部署量化感知訓練網絡的端到端工作流 GTC 課程。有關 PyTorch 量化工具包等效工具,請參閱 PyTorch 量化 . 加速深層神經網絡( DNN )推理是實現實時應用(如圖像分類、圖像分割、自然語言處理等)延遲關鍵部署的重要步驟。 改進 DNN 推理延遲的需要引發了人們對以較低精度運行這些模型的興趣,如 FP16 和 INT8 。

Source

]]>
4327
人人超碰97caoporen国产