TTS – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 04 Nov 2022 08:20:26 +0000 zh-CN hourly 1 196178272 為新語言創建的 NVIDIA Riva ASR 服務 http://www.open-lab.net/zh-cn/blog/making-an-nvidia-riva-asr-service-for-a-new-language/ Fri, 28 Oct 2022 05:35:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5567 Continued]]> Speech AI 是智能系統使用語音接口與用戶進行通信的能力,語音接口在日常生活中已變得無處不在。人們經常通過語音與智能家居設備、車載助手和手機互動。近年來,語音界面質量得到了突飛猛進的改善,使其比十年前更加愉快、實用和自然。 具有語音 AI 接口的智能系統組件包括: ASR 是任何語音 AI 系統的第一個組件,起著至關重要的作用。 ASR 階段早期出現的任何錯誤都會在隨后的意圖分析和實現階段中出現問題。 目前有超過 6500 種口語在使用,其中大多數沒有商業 ASR 產品。 ASR 服務提供商最多覆蓋幾十家。 NVIDIA Riva 目前涵蓋五種語言(英語、西班牙語、德語、普通話和俄語),更多版本將在未來發布。 雖然這一套還很小,但 Riva 為您提供了現成的工作流、工具和指導,以快速、系統、輕松地為新語言提供 ASR 服務。在這篇文章中,

Source

]]>
5567
用 Riva 和 NeMo Megatron 的最新版本構建多種語言的語音 AI ,并訓練大型語言模型 http://www.open-lab.net/zh-cn/blog/build-speech-ai-in-multiple-languages-and-train-large-language-models-with-the-latest-from-riva-and-nemo-megatron/ Mon, 28 Mar 2022 02:43:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3490 Continued]]> 上周, NVIDIA GTC 2022 宣布了對 Riva 的重大更新。 Riva 是一個用于構建語音 AI 應用程序的 SDK ,以及一個付費的 Riva 企業產品。 NeMo Megatron 是一個用于訓練大型語言模型的框架,它的幾項關鍵更新也已宣布。 Riva 為跨多種語言的實時自動語音識別( ASR )和文本到語音( TTS )技能提供了世界級的準確性,并且可以部署在 prem 上、任何云中。 Snap 、 T-Mobile 、 RingCentral 和 Kore 等行業領導者。 ai 在客戶服務中心應用程序、轉錄和虛擬助理中使用 Riva 。 最新的 Riva 版本包括: 在手機上嘗試 Riva 自動語音識別 Riva 產品頁面 . Defined.ai 與 NVIDIA 合作,為希望購買跨語言、

Source

]]>
3490
人人超碰97caoporen国产