Mostofa Patwary

Mostofa Patwary は、NVIDIA の応用ディープラーニング研究チームのシニア ディープラーニング リサーチ サイエンティストです。Mostofa の研究対象は、自然言語処理、スケーラブルなディープラーニング、HPC、アルゴリズム エンジニアリングなどの分野に及びます。NVIDIA に入社する前は Baidu のシリコン バレー AI ラボで大規模言語モデルのスケーリングや、ディープラーニング アプリケーションのスケーリングの予測可能性について研究していました。Mostofa は、スーパーコンピューター上で実行できる機械學習の複數のコア カーネル用大規模コードの開発にも多大な貢獻をしました。

Posts by Mostofa Patwary

Conversational AI / NLP

1 兆トークンのデータセットをキュレーション: NVIDIA NeMo Data Curator のご紹介

大規模言語モデル (LLM) スケーリング則における最新の開発では、モデル パラメーターの數をスケーリングする場合、 2 MIN READ