Retrieval Augmented Generation (RAG) – NVIDIA 技術ブログ http://www.open-lab.net/ja-jp/blog Wed, 09 Apr 2025 08:38:50 +0000 ja hourly 1 NVIDIA Spectrum-X ネットワーキング プラットフォームと NVIDIA パートナーが AI ストレージを最大 48% 高速化 http://www.open-lab.net/ja-jp/blog/accelerating-ai-storage-by-up-to-48-with-nvidia-spectrum-x-networking-platform-and-partners/ Tue, 04 Feb 2025 08:28:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=3282 Reading Time: 2 minutes AI ファクトリーの性能を左右するのはコンピューティング ファブリックだけではありません。GPU を接続する East-West ネットワークは AI アプリケーションのパフォーマンスにとって重要ですが、高速なストレージ … Continued]]> Reading Time: 2 minutes AI ファクトリーの性能を左右するのはコンピューティング ファブリックだけではありません。GPU を接続する East-West ネットワークは AI アプリケーションのパフォーマンスにとって重要ですが、高速なストレージ アレイを接続するストレージ ファブリックも同様に重要です。ストレージ パフォーマンスは、トレーニングのチェックポイント作成や推論手法 (例: 検索拡張生成 (RAG)) など、AI ライフサイクルのいくつかの段階に渡って重要な役割を果たします。 そうした需要に対処するため、NVIDIA とそのストレージ エコシステムは NVIDIA Spectrum-X ネットワーキング プラットフォームをデータ ストレージ ファブリックに拡張しています。この拡張がストレージのパフォーマンスを高め、AI の実行時間を短縮します。

Source

]]>
3282
NVIDIA AI Blueprint でカスタマー サービス向けの AI バーチャル アシスタントを作成する 3 つの構成要素 http://www.open-lab.net/ja-jp/blog/three-building-blocks-for-creating-ai-virtual-assistants-for-customer-service-with-an-nvidia-nim-agent-blueprint/ Wed, 11 Dec 2024 10:02:45 +0000 http://www.open-lab.net/ja-jp/blog/?p=3052 Reading Time: 2 minutes 今日のめまぐるしいビジネス環境では、優れたカスタマー サービスを提供することは、もはや単に「あれば良いこと」ではなく、「必要不可欠なこと」です。技術的な問題への対応、請求に関する質問の解決、サービスの最新情報の提供など、 … Continued]]> Reading Time: 2 minutes 今日のめまぐるしいビジネス環境では、優れたカスタマー サービスを提供することは、もはや単に「あれば良いこと」ではなく、「必要不可欠なこと」です。技術的な問題への対応、請求に関する質問の解決、サービスの最新情報の提供など、顧客は、迅速かつ正確で、顧客の都合にカスタマイズされた対応を期待しています。しかし、このレベルのサービスを実現するには、大きな課題が伴います。 パーソナライズされたリアルタイムのサポートを提供するには、多くの場合、靜的なスクリプトや手作業によるプロセスといった従來のアプローチでは不十分です。さらに、多くのカスタマー サービス業務では、機密性が高くかつ斷片的なデータを取り扱うことになり、厳しいデータ管理とプライバシー規制の対象となります。生成 AI の臺頭により、企業は運用効率の向上、コスト削減、

Source

]]>
3052
NVIDIA AI Workbench によるハイブリッド環境におけるスムーズなコラボレーションと迅速なプロトタイピング http://www.open-lab.net/ja-jp/blog/frictionless-collaboration-and-rapid-prototyping-in-hybrid-environments-with-nvidia-ai-workbench/ Mon, 04 Nov 2024 06:49:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=2964 Reading Time: 3 minutes NVIDIA AI Workbench は、選択したシステムでデータ サイエンス、AI、機械學習 (ML) プロジェクトを合理化する無料の開発環境マネージャーです。 PC、ワークステーション、データ センター、クラウド上 … Continued]]> Reading Time: 3 minutes NVIDIA AI Workbench は、選択したシステムでデータ サイエンス、AI、機械學習 (ML) プロジェクトを合理化する無料の開発環境マネージャーです。 PC、ワークステーション、データ センター、クラウド上で、あるいはそれらをまたがり、スムーズな作成、計算、コラボレーションを行うことを目的としています。基本的なユーザー體験はシンプルです: この記事では、GTC 2024 での製品発表以來、最も重要な NVIDIA AI Workbench の 10 月のリリースにおけるハイライトをご紹介します。製品ビジョン実現に向けた大きな一歩です。 このセクションでは、最新リリースでの主要な新機能とユーザーから要望のあった更新について、詳しく説明します。 主な新機能には以下が含まれます。

Source

]]>
2964
NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化 http://www.open-lab.net/ja-jp/blog/nvidia-gh200-superchip-accelerates-inference-by-2x-in-multiturn-interactions-with-llama-models/ Mon, 28 Oct 2024 07:26:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=3009 Reading Time: 2 minutes 本番環境で大規模言語モデル (LLM) をデプロイする際に、ユーザーのインタラクティブ性の強化と、システムのスループット向上との間で難しいトレードオフを迫られることがよくあります。ユーザーのインタラクティブ性を強化するに … Continued]]> Reading Time: 2 minutes 本番環境で大規模言語モデル (LLM) をデプロイする際に、ユーザーのインタラクティブ性の強化と、システムのスループット向上との間で難しいトレードオフを迫られることがよくあります。ユーザーのインタラクティブ性を強化するには、最初のトークンが出力されるまでの時間 (TTFT: Time To First Token) を最小限に抑える必要がありますが、スループットを向上するには、1 秒あたりのトークン數を増やす必要があります。一方の側面を改善すると、もう一方の側面が悪化することが多いため、データ センター、クラウド サービス プロバイダー (CSP)、AI アプリケーション プロバイダーにとって、適切なバランスを見つけることが困難になっています。 NVIDIA GH200 Grace Hopper Superchip を活用すると、

Source

]]>
3009
NVIDIA NIM Agent Blueprint で AI アプリ向けのデジタル ヒューマン インターフェイスを構築する http://www.open-lab.net/ja-jp/blog/build-a-digital-human-interface-for-ai-apps-with-an-nvidia-nim-agent-blueprint/ Wed, 25 Sep 2024 03:28:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=3030 Reading Time: 2 minutes 顧客に質の高いサービスを提供することは、あらゆる業界の企業にとって最優先事項です。質問への回答や問題のトラブルシューティング、オンライン注文の促進まで、その範囲は多岐にわたります。企業が事業規模を拡大し、競爭力を高めるた … Continued]]> Reading Time: 2 minutes 顧客に質の高いサービスを提供することは、あらゆる業界の企業にとって最優先事項です。質問への回答や問題のトラブルシューティング、オンライン注文の促進まで、その範囲は多岐にわたります。企業が事業規模を拡大し、競爭力を高めるためにグローバルにサービスを展開するのに伴って、シームレスなカスタマー サービスの需要は飛躍的に高まっています。 ナレッジベースの記事を検索したり、複雑な自動音聲案內を辿ったりすることは有用な情報源となり得ますが、顧客が理解しなければならない情報の密度が濃くなると、顧客維持率の低下につながる可能性があります。 生成 AI、対話型 AI、ビジュアル AI などのテクノロジの統合により、アプリケーション開発チームは、セルフサービス型の顧客アプリケーションへのエンゲージメントを高め、

Source

]]>
3030
NVIDIA NIM による財務分析の変革 http://www.open-lab.net/ja-jp/blog/transforming-financial-analysis-with-nvidia-nim/ Fri, 28 Jun 2024 14:08:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=2762 Reading Time: 4 minutes 金融サービスでは、ポートフォリオ マネージャーやリサーチ アナリストが膨大な量のデータを丹念に精査し、投資で競爭力を高めています。情報に基づいた意思決定を行うには、最も関連性の高いデータにアクセスし、そのデータを迅速に統 … Continued]]> Reading Time: 4 minutes 金融サービスでは、ポートフォリオ マネージャーやリサーチ アナリストが膨大な量のデータを丹念に精査し、投資で競爭力を高めています。情報に基づいた意思決定を行うには、最も関連性の高いデータにアクセスし、そのデータを迅速に統合して解釈する能力が必要です。 従來、セルサイド アナリストやファンダメンタル ポートフォリオ マネージャーは、財務諸表、収益報告、企業提出書類を綿密に調べ、一部の企業に焦點を當ててきました。より広範な取引対象範囲にわたって財務文書を體系的に分析することで、さらなる洞察を得ることができます。このようなタスクは技術的およびアルゴリズム的に難しいため、広範な取引対象範囲にわたるトランスクリプトの體系的な分析は、最近まで、高度なクオンツ トレーディング (quant-trading) 會社にしかできませんでした。

Source

]]>
2762
マルチモーダル検索拡張生成 (RAG) の簡単な紹介 http://www.open-lab.net/ja-jp/blog/an-easy-introduction-to-multimodal-retrieval-augmented-generation/ Wed, 20 Mar 2024 05:34:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=2407 Reading Time: 3 minutes 検索拡張生成 (RAG) アプリケーションで、テキストだけでなく、表、グラフ、チャート、図など、さまざまな種類のデータを処理できれば、その有用性が飛躍的に高まります。そのためには、テキストや畫像などの形式の情報を一貫して … Continued]]> Reading Time: 3 minutes 検索拡張生成 (RAG) アプリケーションで、テキストだけでなく、表、グラフ、チャート、図など、さまざまな種類のデータを処理できれば、その有用性が飛躍的に高まります。そのためには、テキストや畫像などの形式の情報を一貫して理解し、応答を生成することができるフレームワークが必要です。 この記事では、マルチモダリティ (複數の種類のデータ) を扱う上での課題と、マルチモーダル RAG パイプラインを構築するためのアプローチについて説明します。説明を簡潔にするために、畫像とテキストの 2 つのモダリティのみに焦點を當てます。 企業が扱う非構造化データは、フォルダーをいっぱいにしている高解像度の畫像や、テキストが含まれる表、グラフ、図などが混在した PDF のように、

Source

]]>
2407
RAG アプリケーションを 4 つのステップでパイロットから本番環境に移行する方法 http://www.open-lab.net/ja-jp/blog/how-to-take-a-rag-application-from-pilot-to-production-in-four-steps/ Mon, 18 Mar 2024 03:00:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=2625 Reading Time: 3 minutes 生成 AI はあらゆる産業を変革する可能性を秘めています。私たちは、困難な認知作業を説明し、論理的に推論し、解決する目的ですでに大規模言語モデル (LLM) を使用しています。検索拡張生成 (RAG) は LLM をデー … Continued]]> Reading Time: 3 minutes 生成 AI はあらゆる産業を変革する可能性を秘めています。私たちは、困難な認知作業を説明し、論理的に推論し、解決する目的ですでに大規模言語モデル (LLM) を使用しています。検索拡張生成 (RAG) は LLM をデータに接続し、LLM が最新の正確な情報にアクセスできるようにすることで LLM の利便性をさらに高めます。 多くの企業がすでに RAG で業務プロセスを自動化し、データからインサイトを発掘する方法を探り始めています。ほとんどの企業が生成 AI のユース ケースに合わせた複數のパイロットプロジェクトを始めていますが、そのほとんど (90%) は近い將來に評価フェーズから先に進むことはないと推定されています。人々を惹きつける RAG のデモを、真のビジネス価値を提供する本番環境サービスに変換することは、

Source

]]>
2625
LLM テクニックの習得: LLMOps http://www.open-lab.net/ja-jp/blog/mastering-llm-techniques-llmops/ Wed, 15 Nov 2023 07:22:37 +0000 http://www.open-lab.net/ja-jp/blog/?p=2252 Reading Time: 3 minutes 企業は、イノベーションを起こし、顧客に価値を提供し、競爭力を維持するために、これまで以上にデータと AI に依存しています。機械學習 (ML) の導入は、信頼性が高く、コスト パフォーマンスがよく、スケーラブルなコード、 … Continued]]> Reading Time: 3 minutes 企業は、イノベーションを起こし、顧客に価値を提供し、競爭力を維持するために、これまで以上にデータと AI に依存しています。機械學習 (ML) の導入は、信頼性が高く、コスト パフォーマンスがよく、スケーラブルなコード、データ、モデルを管理するためのツールやプロセス、組織原則の必要性を生じさせました。これは MLOps として広く知られています。 世界は、特に基盤モデルと大規模言語モデル (LLM) を活用した新しい生成 AI 時代に急速に突入しています。ChatGPT のリリースにより、この変化はさらに加速されました。 GenAIOps と LLMOps の新しい専門領域は、本番環境での生成 AI および LLM を利用したアプリの開発と管理の課題に対処するための MLOps の進化として登場しました。

Source

]]>
2252
人人超碰97caoporen国产