Xin Dong

Xin Dong は NVIDIA Research の研究員であり、LLM および基盤モデル向けの正確で効率的かつ信頼性の高いシステムの設計に関心を持っています。2023 年にハーバード大學でコンピューター サイエンスの博士號を取得し、H.T. Kung 教授の指導を受けました。

Posts by Xin Dong

Generative AI

Hymba ハイブリッド ヘッド アーキテクチャが小規模言語モデルのパフォーマンスを向上

Hymba 1.5B は、同様の規模である最先端のオープンソース モデルと比べ、良好なパフォーマンスを発揮し、同等のサイズの Transformer モデルで比較すると、Hymba はより高いスループットを発揮し、キャッシュを保存するために必要なメモリが 10 分の 1 で済みます。 4 MIN READ