Somshubra Majumdar

Somshubra Majumdar 是 NVIDIA NeMo 工具包的資深研究科學家。他于 2016 年獲得孟買大學計算機工程學士學位， 2018 年獲得芝加哥伊利諾伊大學計算機科學碩士學位。他的研究興趣包括自動語音識別、語音分類、時間序列分類和深度學習的實際應用。

Posts by Somshubra Majumdar

對話式人工智能 2024年 4月 18日

NVIDIA NeMo Parakeet 是一個端到端平臺，用于在任何地方（任何云端和本地）大規模開發多模態生成式 AI 模型， 2 MIN READ

對話式人工智能 2024年 4月 18日

NVIDIA NeMo 是一個端到端平臺，用于在任何云和本地的任何地方大規模開發多模式生成 AI 模型，最近發布了 Parakeet-TDT。 2 MIN READ

對話式人工智能 2024年 3月 19日

NVIDIA 開發的語音和翻譯 AI 模型正在推動性能和創新的發展。NVIDIA Parakeet 自動語音識別 (ASR) 模型系列以及… 2 MIN READ

對話式人工智能/自然語言處理 2023年 2月 3日

你有沒有試過在你的口音上微調語音識別系統，結果發現，雖然它能很好地識別你的聲音，但卻無法檢測到別人說的話？ 2 MIN READ

對話式人工智能 2022年 9月 12日

自動語音識別（ ASR ）研究通常側重于高資源語言，如英語，它由數十萬小時的語音支持。最近的文獻重新關注更復雜的語言，如日語。 1 MIN READ