Text Generation – NVIDIA 技術ブログ http://www.open-lab.net/ja-jp/blog Tue, 12 Nov 2024 07:00:40 +0000 ja hourly 1 Megatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発 http://www.open-lab.net/ja-jp/blog/developing-a-172b-llm-with-strong-japanese-capabilities-using-nvidia-megatron-lm/ Mon, 11 Nov 2024 06:42:45 +0000 http://www.open-lab.net/ja-jp/blog/?p=2905 Reading Time: 2 minutes 生成 AI は、その卓越した能力のおかげで、従來の機械學習手法ではできなかったタスクを実行し、注目を集めています。例えば、自然言語処理の分野では、大規模言語モデル (LLM) が登場したことで、チャットボットによるカスタ … Continued]]> Reading Time: 2 minutes 生成 AI は、その卓越した能力のおかげで、従來の機械學習手法ではできなかったタスクを実行し、注目を集めています。例えば、自然言語処理の分野では、大規模言語モデル (LLM) が登場したことで、チャットボットによるカスタマー サポートや會議內容の要約など、これまで人間が擔っていた役割を AI が代わりに行うなど多くの革新的で創造的なユース ケースが生まれています。 LLM は、パラメーター數の増加や MoE (Mixture of Experts) のような新しいアルゴリズムの採用など、様々なアプローチを通じて進化し続けており、小売業、製造業、金融業など、さまざまな業界への応用と適用が期待されています。 しかし、現在 LLM リーダーボードの上位モデルの多くは、

Source

]]>
2905
LLM テクニックの習得: トレーニング http://www.open-lab.net/ja-jp/blog/mastering-llm-techniques-training/ Thu, 16 Nov 2023 09:24:04 +0000 http://www.open-lab.net/ja-jp/blog/?p=2263 Reading Time: 3 minutes 大規模言語モデル (LLM) は、非常に大規模なデータセットを使用して言語を認識、要約、翻訳、予測、生成できる Transformer ネットワークを使用して構築された生成 AI モデルのクラスです。ご存知の通り、LLM … Continued]]> Reading Time: 3 minutes 大規模言語モデル (LLM) は、非常に大規模なデータセットを使用して言語を認識、要約、翻訳、予測、生成できる Transformer ネットワークを使用して構築された生成 AI モデルのクラスです。ご存知の通り、LLM は社會を変革する可能性を秘めていますが、このような基盤モデルのトレーニングは非常に困難です。 このブログでは、Transformer ネットワークを使用して構築された LLM の背後にある基本原則を、モデル アーキテクチャ、アテンション メカニズム、埋め込み手法、基盤モデルのトレーニング戦略にわたり説明します。 モデル アーキテクチャは Transformer ネットワークのバックボーンを定義し、モデルの能力や制限を広く決定づけます。 LLM のアーキテクチャは、しばしば、エンコーダー、

Source

]]>
2263
NVIDIA AI Foundation モデル: 本番利用可能な LLM を使用して、企業向けのカスタムチャットボットとコパイロットを構築 http://www.open-lab.net/ja-jp/blog/nvidia-ai-foundation-models-build-custom-enterprise-chatbots-and-co-pilots-with-production-ready-llms/ Wed, 15 Nov 2023 05:38:11 +0000 http://www.open-lab.net/ja-jp/blog/?p=2151 Reading Time: 3 minutes 大規模言語モデル (LLM) は自然言語理解、AI、機械學習における高度な機能を実現し、データ サイエンスに革命をもたらしています。ドメイン固有の洞察に合わせてカスタマイズされた LLM は、企業向けアプリケーションでま … Continued]]> Reading Time: 3 minutes 大規模言語モデル (LLM) は自然言語理解、AI、機械學習における高度な機能を実現し、データ サイエンスに革命をもたらしています。ドメイン固有の洞察に合わせてカスタマイズされた LLM は、企業向けアプリケーションでますます注目されています。 NVIDIA Nemotron-3 8B ファミリの基盤モデルは、カスタマー サービス AI チャットボットから最先端の AI 製品にまで、企業向けに本番利用可能な生成 AI アプリケーションを構築するための強力な新しいツールです。 これらの新しい基盤モデルは、企業での利用に合わせて LLM を構築、カスタマイズ、展開するためのエンドツーエンドのフレームワークである NVIDIA NeMo の一部です。企業はこのツールを使用することで、

Source

]]>
2151
Azure Machine Learning 上の NVIDIA AI で企業向け生成 AI アプリ開発を強化 http://www.open-lab.net/ja-jp/blog/elevate-enterprise-generative-ai-app-development-with-nvidia-ai-on-azure-machine-learning/ Wed, 15 Nov 2023 04:51:45 +0000 http://www.open-lab.net/ja-jp/blog/?p=2139 Reading Time: 2 minutes 生成 AI は、あらゆる産業において、データを活用して生産性を向上させ、パーソナライズされた顧客エンゲージメントを進め、イノベーションを促進する方法を革新しています。その価値が非常に高いため、企業は、この新しい技術を自社 … Continued]]> Reading Time: 2 minutes 生成 AI は、あらゆる産業において、データを活用して生産性を向上させ、パーソナライズされた顧客エンゲージメントを進め、イノベーションを促進する方法を革新しています。その価値が非常に高いため、企業は、この新しい技術を自社の事業運営や戦略に効果的かつ信頼性の高い方法で統合するのに役立つツールと専門知識を求めています。 NVIDIA と Microsoft は、Azure Machine Learning (Azure ML) 上の NVIDIA AI を使用して、生成 AI を含む AI アプリケーションを構築、最適化、展開するための包括的なソリューションを企業に提供するために協力しています。 今週開催された Microsoft Ignite で、NVIDIA と Microsoft は新たに 2…

Source

]]>
2139
大規模言語モデルのカスタマイズ手法を選択する http://www.open-lab.net/ja-jp/blog/selecting-large-language-model-customization-techniques/ Thu, 10 Aug 2023 02:23:11 +0000 http://www.open-lab.net/ja-jp/blog/?p=1919 Reading Time: 3 minutes 大規模言語モデル (LLM) は、企業が業務、顧客とのやり取り、意思決定プロセスを改善するために不可欠なツールになりつつあります。しかし、既製の LLM では、業界固有の用語や専門知識、または獨自の要件が原因となって、企 … Continued]]> Reading Time: 3 minutes 大規模言語モデル (LLM) は、企業が業務、顧客とのやり取り、意思決定プロセスを改善するために不可欠なツールになりつつあります。しかし、既製の LLM では、業界固有の用語や専門知識、または獨自の要件が原因となって、企業の個別のニーズを満たすことができないことがよくあります。 ここで役立つのが、カスタム LLM です。 企業には、言語処理機能を自社特有のユースケースや専門知識に合わせてカスタマイズするためのカスタム モデルが必要です。企業はカスタム LLM により、業界內や組織の事情に合わせてテキストをより効率的かつ正確に生成、理解できるようになります。 カスタム モデルがあれば、自社の個性に合うパーソナライズされたソリューションの開発、ワークフローの最適化、インサイトの正確性向上、

Source

]]>
1919
信頼性、安全性、セキュリティに優れた大規模言語モデル対話システムを実現 http://www.open-lab.net/ja-jp/blog/nvidia-enables-trustworthy-safe-and-secure-large-language-model-conversational-systems/ Tue, 25 Apr 2023 04:48:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=1681 Reading Time: < 1 minute 大規模言語モデル?(LLM) は非常に強力で、複雑な質問への回答、創作的な文章の作成、ソース コードの開発やデバッグなどのさまざまなことが可能です。LLM を外部のツールに接続することで、例えばリアルタイムにデータを読み … Continued]]> Reading Time: < 1 minute 大規模言語モデル (LLM) は非常に強力で、複雑な質問への回答、創作的な文章の作成、ソース コードの開発やデバッグなどのさまざまなことが可能です。LLM を外部のツールに接続することで、例えばリアルタイムにデータを読み込んだり、ユーザーの要求に対して LLM がどのようなアクションを実行するか決定したり、非常に高度な LLM アプリケーションを構築することできます。しかし、このような LLM アプリケーションを安全かつセキュアな方法で構築することは容易ではありません。 NeMo Guardrails は、安全性と信頼性の高い LLM 対話システムを容易に開発するためのオープンソースのツールキットです。生成 AI における安全性は、業界全體の懸念事項です。そこで、NVIDIA は OpenAI の ChatGPT…

Source

]]>
1681
人人超碰97caoporen国产