Kazuki Fujii – NVIDIA 技術ブログ
http://www.open-lab.net/ja-jp/blog
Tue, 12 Nov 2024 07:00:40 +0000
ja
hourly
1
-
Megatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発
http://www.open-lab.net/ja-jp/blog/developing-a-172b-llm-with-strong-japanese-capabilities-using-nvidia-megatron-lm/
Mon, 11 Nov 2024 06:42:45 +0000
http://www.open-lab.net/ja-jp/blog/?p=2905
Reading Time: 2 minutes 生成 AI は、その卓越した能力のおかげで、従來の機械學習手法ではできなかったタスクを実行し、注目を集めています。例えば、自然言語処理の分野では、大規模言語モデル (LLM) が登場したことで、チャットボットによるカスタ … Continued]]>
Reading Time: 2 minutes 生成 AI は、その卓越した能力のおかげで、従來の機械學習手法ではできなかったタスクを実行し、注目を集めています。例えば、自然言語処理の分野では、大規模言語モデル (LLM) が登場したことで、チャットボットによるカスタマー サポートや會議內容の要約など、これまで人間が擔っていた役割を AI が代わりに行うなど多くの革新的で創造的なユース ケースが生まれています。 LLM は、パラメーター數の増加や MoE (Mixture of Experts) のような新しいアルゴリズムの採用など、様々なアプローチを通じて進化し続けており、小売業、製造業、金融業など、さまざまな業界への応用と適用が期待されています。 しかし、現在 LLM リーダーボードの上位モデルの多くは、
Source
]]>
2905
人人超碰97caoporen国产