Somshubra Majumdar

Somshubra Majumdar 是 NVIDIA NeMo 工具包的資深研究科學家。他于 2016 年獲得孟買大學計算機工程學士學位, 2018 年獲得芝加哥伊利諾伊大學計算機科學碩士學位。他的研究興趣包括自動語音識別、語音分類、時間序列分類和深度學習的實際應用。

Posts by Somshubra Majumdar

對話式人工智能

借助 NVIDIA NeMo Parakeet ASR 模型突破語音識別的界限

NVIDIA NeMo Parakeet 是一個端到端平臺,用于在任何地方(任何云端和本地)大規模開發多模態生成式 AI 模型, 2 MIN READ
對話式人工智能

借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的準確性和速度

NVIDIA NeMo 是一個端到端平臺,用于在任何云和本地的任何地方大規模開發多模式生成 AI 模型,最近發布了 Parakeet-TDT。 2 MIN READ
對話式人工智能

NVIDIA 語音和翻譯 AI 模型在速度和準確性方面創下記錄

NVIDIA 開發的語音和翻譯 AI 模型正在推動性能和創新的發展。NVIDIA Parakeet 自動語音識別 (ASR) 模型系列以及… 2 MIN READ
對話式人工智能/自然語言處理

語音識別模型對新領域的受控適應

你有沒有試過在你的口音上微調語音識別系統,結果發現,雖然它能很好地識別你的聲音,但卻無法檢測到別人說的話? 2 MIN READ
對話式人工智能

結合卷積和注意機制改進日語 ASR

自動語音識別( ASR )研究通常側重于高資源語言,如英語,它由數十萬小時的語音支持。最近的文獻重新關注更復雜的語言,如日語。 1 MIN READ