Yonggan Fu

Yonggan Fu は、NVIDIA Research に參加予定の研究者であり、現在はジョージア工科大學博士課程の學生として、Yingyan (Celine) Lin 博士の指導を受けています。研究では、言語モデルとビジョン モデルのための効率的で堅牢な AI アルゴリズムの開発に注力しています。

Posts by Yonggan Fu

Generative AI

Hymba ハイブリッド ヘッド アーキテクチャが小規模言語モデルのパフォーマンスを向上

Hymba 1.5B は、同様の規模である最先端のオープンソース モデルと比べ、良好なパフォーマンスを発揮し、同等のサイズの Transformer モデルで比較すると、Hymba はより高いスループットを発揮し、キャッシュを保存するために必要なメモリが 10 分の 1 で済みます。 4 MIN READ