Posts by Somshubra Majumdar
對話式人工智能
2024年 4月 18日
借助 NVIDIA NeMo Parakeet ASR 模型突破語音識別的界限
NVIDIA NeMo Parakeet 是一個端到端平臺,用于在任何地方(任何云端和本地)大規模開發多模態生成式 AI 模型,
2 MIN READ
對話式人工智能
2024年 4月 18日
借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的準確性和速度
NVIDIA NeMo 是一個端到端平臺,用于在任何云和本地的任何地方大規模開發多模式生成 AI 模型,最近發布了 Parakeet-TDT。
2 MIN READ
對話式人工智能
2024年 3月 19日
NVIDIA 語音和翻譯 AI 模型在速度和準確性方面創下記錄
NVIDIA 開發的語音和翻譯 AI 模型正在推動性能和創新的發展。NVIDIA Parakeet 自動語音識別 (ASR) 模型系列以及…
2 MIN READ
對話式人工智能/自然語言處理
2023年 2月 3日
語音識別模型對新領域的受控適應
你有沒有試過在你的口音上微調語音識別系統,結果發現,雖然它能很好地識別你的聲音,但卻無法檢測到別人說的話?
2 MIN READ
對話式人工智能
2022年 9月 12日
結合卷積和注意機制改進日語 ASR
自動語音識別( ASR )研究通常側重于高資源語言,如英語,它由數十萬小時的語音支持。最近的文獻重新關注更復雜的語言,如日語。
1 MIN READ