Scot Junkin – NVIDIA 技術ブログ
http://www.open-lab.net/ja-jp/blog
Wed, 27 Nov 2024 06:19:04 +0000
ja
hourly
1
-
NVIDIA NIM で LoRA アダプター群をシームレスにデプロイ
http://www.open-lab.net/ja-jp/blog/seamlessly-deploying-a-swarm-of-lora-adapters-with-nvidia-nim/
Fri, 07 Jun 2024 06:18:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=2934
Reading Time: 3 minutes 最新の基盤である最先端の大規模言語モデル (LLM) は、數十億ものパラメーターを持ち、數兆もの入力テキスト トークンで事前學習されています。多くの場合、カスタマイズの必要なく、幅広いユース ケースで著しい成果を上げてい … Continued]]>
Reading Time: 3 minutes 最新の基盤である最先端の大規模言語モデル (LLM) は、數十億ものパラメーターを持ち、數兆もの入力テキスト トークンで事前學習されています。多くの場合、カスタマイズの必要なく、幅広いユース ケースで著しい成果を上げています。それにもかかわらず、研究では、下流のタスクで最高の精度を達成するためには、高品質でドメイン固有のデータセットで LLM を適合させる必要があることが示されています。 多くの場合、カスタマイズされた小規模モデルは、より大規模な汎用LLM と同等あるいはそれを上回るパフォーマンスを発揮することが可能であり、同時にデプロイにかかるコストを大幅に削減することができます。しかし、特定の下流タスクのためにモデルをカスタマイズする作業は、作成とデプロイの両方に重大な課題をもたらす可能性があります。
Source
]]>
2934
人人超碰97caoporen国产