• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 加速計算

    圖靈 H.264 視頻編碼速度和質量

    ?

    從開普勒開始的所有 NVIDIA GPUs 都支持完全加速的硬件視頻編碼; GPUs 從費米開始支持完全加速的硬件視頻解碼。最近發布的圖靈硬件提供了張量核心和更好的機器學習性能,但新的 GPU 還加入了新的多媒體功能,如改進的 NVENC 單元,以在視頻編解碼器中提供更好的壓縮和圖像質量。

    讓我們更仔細地看一看圖靈設計的新的 NVENC 單元的性能和質量。

    NVENC 性能測試設置

    H.264 出現于 15 年前,已經成為一種無處不在的視頻編碼標準。它已經成為業界最重要和最廣泛的編解碼器。這些測試展示了 Tesla T4 與著名的開源編碼器 libx264 在兩種情況下的性能:

    • 高質量模式,代表最常見的編碼方案與 VBR 控制和 B 幀啟用。
    • 低延遲快速模式,適用于對延遲敏感的應用程序,如遠程游戲或視頻會議。

    為此,測試計算機的配置如表 1 所示:

    Testing Configuration
    Component Tesla T4 NVENC libx264
    CPU Dual Intel Xeon E5-2660v3 @ 2.6 GHz Dual Intel Xeon E5-2660v3 @ 2.6 GHz
    GPU TU104 (Tesla T4) N/A
    RAM 128 GB 128 GB
    FFMPEG 4.0.2 4.0.2
    Driver 415.15 N/A

    這些性能測試將編碼參數設置為表 2 中所示的參數:

    Encoding Parameters
    Preset NVENC libx264
    High Quality -c:v h264_nvenc -preset medium -b:v BITRATE -bufsize BITRATE*2 -profile:v high -bf 3 -b_ref_mode 2 -temporal-aq 1 -rc-lookahead 20 -vsync 0 -c:v libx264 -preset medium -b:v BITRATE -bufsize BITRATE*2 -profile:v high -tune psnr -vsync 0 -threads 4
    Low Latency Fast -c:v h264_nvenc -preset llhp -rc cbr_ld_hq -b:v BITRATE -bufsize BITRATE/FRATE -profile:v high -g 999999 -vsync 0 -c:v libx264 -preset fast -b:v BITRATE -bufsize BITRATE/FRATE -profile:v high -g 999999 -x264opts no-sliced-threads:nal-hrd=cbr -tune zerolatency -threads 4 -vsync 0

    我們使用了各種輸入視頻進行 RD 估計,如 basketball _ drive 、 bq _ terrace 、仙人掌、 crowd _ run 、 ducks _ take _ off 、 jokey 、和服,以及更多分辨率為 1280 × 720 、 1920 × 1080 和 3840 × 2160 的視頻。

    績效和質量結果

    平衡序列

    圖 1 到圖 4 顯示, Tesla T4 在高質量模式下為 libx264 提供相同或稍好的視覺質量,如 Kimono、 BQ Terrace 和 Park Scene 。

    PSNR RD curve chart for Kimono in 720p
    圖 1 。 720p 分辨率和服序列的 PSNR-RD 曲線。
    PSNR RD curve chart for BQ terrace in 1080p
    圖 2 。 BQ 階地序列 1080p 分辨率下的 PSNR-RD 曲線。
    PSNR RD curve chart for Park Scene in 720p
    圖 3 。公園場景序列在 720p 分辨率下的 PSNR-RD 曲線。
    PSNR RD curve chart for Park Scene in 1080p
    圖 4 。公園場景序列的 PSNR-RD 曲線,分辨率為 1080p 。

    與 libx264 相比, T4 顯示了更好的預測和過濾,如圖 5 和 6 所示。

    bq terrace libx264 image
    圖 5 。由 libx264 編碼的 bq _ terrace 序列的幀。(點擊查看大圖)
    bq terrace nvenc image
    圖 6 。 T4-Nvenc 編碼的 bq_terrace 序列的幀。(點擊查看大圖)

    高運動序列

    紅皮艇和仙人掌序列分別包含顯著的混沌運動和圓周運動。與 libx264 相比, NVENC 在這些包含復雜內部預測的場景中顯示出明顯的優勢,如圖 7 和 8 所示。

    PSNR RD curve chart for Red Kayak sequence, 1080p
    圖 7 。紅皮艇序列在 1080p 分辨率下的 PSNR-RD 曲線。
    PSNR RD curve chart for Cactus sequence, 1080p
    圖 8 。仙人掌序列 1080p 分辨率的 PSNR-RD 曲線。

    如圖 9 和圖 10 所示, Tesla T4 NVENC 在低延遲模式下的性能很容易超過 libx264 。請注意 Tesla T4 如何在高分辨率下更有效,在相同的比特率下提供 1db 更好的視覺質量。

    PSNR RD curve chart for Cactus sequence, 1080p
    圖 9 。 1080p 分辨率和低延遲模式下仙人掌序列的 PSNR-RD 曲線
    PSNR RD curve chart for Ducks Take Off in 2160p
    圖 10 。鴨起飛序列在 2160p 分辨率下的 PSNR-RD 曲線。

    如圖 11 和圖 12 所示,視覺質量的差異很容易被肉眼看到:

    ducks take off 3840x2160 420 8 30 500.y4m libx264 ll 8M.H264 0 3840x2160 decoded
    圖 11 。由 libx264 編碼的 ducks_take_off 序列的第一幀。(點擊查看大圖)
    ducks take off 3840x2160 420 8 30 500.y4m nvenc ll 8M.H264 0 3840x2160 decoded
    圖 12 。由 T4 NVENC 編碼的鴨子取下序列的第一幀。(點擊查看大圖)

    圖靈 GPUs 配備了功能強大的 NVENC 視頻編碼單元,與 libx264 等復雜的軟件編碼器相比,它提供了更高的視頻壓縮效率,因為它結合了更高的性能和更低的能耗。理想的代碼轉換解決方案需要具有成本效益(美元/流)和節能(瓦/流)。讓我們看看在多個測試序列中平均的性能和功耗結果,如圖 13 和 14 所示。

    HQ simultaneous streams at 30fps chart
    圖 13 。在高質量模式下以每秒 30 幀同時編碼的流數
    Simultaneous encoded 30fps streams chart
    圖 14 。在低延遲模式下以每秒 30 幀同時編碼的流數。

    T4 以高質量模式同時編碼 22 個 720p 流。 GPU 還可以平均處理 10 個 1080p 的流和 2 到 3 個超高清( 2160p )分辨率的流。這相當于在相同的視覺質量級別上幾乎是 libx264 的兩倍。

    在低延遲模式下運行顯示出 T4 更大的優勢。它可以編碼 37 個 720p 分辨率的流, 17-18 個 1080p , 4-5 個超高清,性能比 libx264 高 2-2 . 7 倍,具有更高的視覺質量。您可以在圖 15 和圖 16 中看到每個流的瓦特數。

    Watts per stream power in HQ mode chart
    圖 15 。高質量模式下平均每流功耗瓦特
    Watts per stream, low-latency mode chart
    圖 16 。低延遲模式下平均每流功耗瓦特

    Tesla 還顯示出很高的功率效率,在高質量模式下優于 libx264 2-4x ,在低延遲模式下高達 5 倍,同時保持低負載。 CPU

    結論

    與前幾代相比, NVIDIA 的 Tesla T4 的編碼能力有了很大的提高。與 libx264 這樣的軟件編碼器相比,它在高質量模式下顯示出相同或更好的視覺質量,而在低延遲模式下則優于它們。這相當于在功耗降低 2-5 倍時性能提高了一倍。

    0

    標簽

    人人超碰97caoporen国产