TTS – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。Fri, 04 Nov 2022 08:20:26 +0000zh-CN
hourly
1 196178272為新語言創建的 NVIDIA Riva ASR 服務
http://www.open-lab.net/zh-cn/blog/making-an-nvidia-riva-asr-service-for-a-new-language/
Fri, 28 Oct 2022 05:35:00 +0000http://www.open-lab.net/zh-cn/blog/?p=5567Continued]]>Speech AI 是智能系統使用語音接口與用戶進行通信的能力,語音接口在日常生活中已變得無處不在。人們經常通過語音與智能家居設備、車載助手和手機互動。近年來,語音界面質量得到了突飛猛進的改善,使其比十年前更加愉快、實用和自然。 具有語音 AI 接口的智能系統組件包括: ASR 是任何語音 AI 系統的第一個組件,起著至關重要的作用。 ASR 階段早期出現的任何錯誤都會在隨后的意圖分析和實現階段中出現問題。 目前有超過 6500 種口語在使用,其中大多數沒有商業 ASR 產品。 ASR 服務提供商最多覆蓋幾十家。 NVIDIA Riva 目前涵蓋五種語言(英語、西班牙語、德語、普通話和俄語),更多版本將在未來發布。 雖然這一套還很小,但 Riva 為您提供了現成的工作流、工具和指導,以快速、系統、輕松地為新語言提供 ASR 服務。在這篇文章中,