• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 對話式人工智能

    NVIDIA NeMo ASR 發布了對荷蘭語和波斯語的新支持

    ?

    為了打破語音識別的障礙,NVIDIA NeMo自豪地推出了專為 AI 領域中常被忽視的荷蘭語和波斯語設計的預訓練模型。

    這些模型采用了最新推出的 FastConformer 技術,并結合 CTC 和傳感器目標進行同步訓練,以最大程度提升每個模型的準確性。

    自動語音識別(ASR)是對話式 AI 應用的基礎技術,因為它使用戶能夠使用語音與 AI 系統和其他設備進行通信。它還廣泛用于對話式分析和音頻字幕,從而實現更廣泛的內容訪問。

    波斯語語音識別模型

    Persian 模型基于 Mozilla 的 Common Voice (MCV) 15.0 波斯數據構建。值得注意的是,兩種技術對于提高模型性能至關重要:一是從預訓練的英語檢查點初始化,二是自定義訓練測試分割,這允許額外使用 300 小時的 MCV 驗證記錄。

    此模型在評估中實現了 13.16%的詞錯誤率 (WER) 和 3.85%的字符錯誤率 (CER).雖然 WER 是 ASR 的標準指標,但由于復合詞表示法的靈活性,它不一定能很好地反映波斯語中的 ASR 性能。這意味著合成詞可能不會被空格分開。在這些情況下,CER 可能更真實地指示 ASR 系統的準確性。

    荷蘭文語音識別模型

    荷蘭模型的訓練時間為 40 小時,使用了MCV 數據集、多語種 LibriSpeech (MLS) 和 34 小時的VoxPopuli 數據。

    此模型在 MCV 和 MLS 評估中實現了 9.9%和 12.5%的詞錯誤率,在可用的開源荷蘭模型中名列前茅。此模型還可以生成帶有標點符號和大寫的腳本。

    試用模型

    這些模型已獲得 CC-4.0 許可證 授權,可用于商業用途。它們可在 NGC 和 HuggingFace 上下載:


    ?

    0

    標簽

    人人超碰97caoporen国产