NIM – NVIDIA 技術ブログ
http://www.open-lab.net/ja-jp/blog
Tue, 22 Apr 2025 08:00:53 +0000
ja
hourly
1
-
Spotlight: DataStax Langflow で再現する NVIDIA AI Blueprints をマクニカの AI TRY NOW PROGRAM で検証可能に
http://www.open-lab.net/ja-jp/blog/spotlight-nvidia-ai-blueprints-reproduced-with-datastax-langflow-can-be-tried-with-macnica-ai-try-now-program/
Fri, 18 Apr 2025 00:12:57 +0000
http://www.open-lab.net/ja-jp/blog/?p=3294
Reading Time: 2 minutes 本記事は マクニカ、DataStax、NVIDIA の 3 社で共同執筆しています。 AI エージェントとは、複數の AI や Tool を組み合わせ、従來の AI ではできない複雑なタスクや複數のタスクを自律的に実行す … Continued ]]>
Reading Time: 2 minutes 本記事は マクニカ、DataStax、NVIDIA の 3 社で共同執筆しています。 AI エージェントとは、複數の AI や Tool を組み合わせ、従來の AI ではできない複雑なタスクや複數のタスクを自律的に実行するための高度なシステムです。AI エージェントは設定された環境やフィードバックを基にタスクを実行し、データの分析、意思決定の支援、問題解決など、様々なタスクを実行します。CES 2025 や GTC 2025 にて、NVIDIA の CEO Jensen Huang はこれまでの RAG のシステムを代表する Generative AI (生成 AI) から Agentic AI (エージェント型 AI) への移行、つまり様々な業界のタスクを支援できる AI エージェントの可能性を示唆し、
Source
]]>
3294
-
NVIDIA のフルスタック ソリューションで AI 推論のパフォーマンスを最適化
http://www.open-lab.net/ja-jp/blog/optimize-ai-inference-performance-with-nvidia-full-stack-solutions/
Thu, 10 Apr 2025 07:21:58 +0000
http://www.open-lab.net/ja-jp/blog/?p=3287
Reading Time: 2 minutes AI 搭載アプリケーションの急速な増加に伴い、開発者と AI インフラは、最先端のパフォーマンスを提供しつつ、運用の複雑さとコストを管理するという課題に直面しています。これにより、これまでにないほどの高い要求が両者に課さ … Continued ]]>
Reading Time: 2 minutes AI 搭載アプリケーションの急速な増加に伴い、開発者と AI インフラは、最先端のパフォーマンスを提供しつつ、運用の複雑さとコストを管理するという課題に直面しています。これにより、これまでにないほどの高い要求が両者に課されています。 NVIDIA は、AI 推論の可能性を再定義し、これまで以上に高速で、効率的かつスケーラブルなソリューションを提供するために、フルスタックのイノベーションを通じて開発者を支援しており、その範囲はチップ、システム、ソフトウェアにまで及びます。 6 年前、NVIDIA は、高スループットで遅延が重大な課題となる本番環境アプリケーションを構築する開発者向けに、特別設計された AI 推論サーバーの構築に著手しました。當時多くの開発者は、
Source
]]>
3287
-
リランキングモデルによる RAG の日本語検索精度の向上
http://www.open-lab.net/ja-jp/blog/rag-with-sota-reranking-model-in-japanese/
Mon, 03 Mar 2025 06:03:24 +0000
http://www.open-lab.net/ja-jp/blog/?p=3207
Reading Time: 7 minutes ChatGPT が登場して以降、多くの企業/組織にて生成 AI の活用が進んでいます。その中でも LLM (Large Language Model、大規模言語モデル) は大量の知識を學習することで幅広い分野の問題を解決 … Continued ]]>
Reading Time: 7 minutes ChatGPT が登場して以降、多くの企業/組織にて生成 AI の活用が進んでいます。その中でも LLM (Large Language Model、大規模言語モデル) は大量の知識を學習することで幅広い分野の問題を解決することができます。LLM は學習した知識には適切な回答ができるも一方で、社內ナレッジなど學習には含まれていない事がらに関する回答は得意ではありません。LLM が特定の領域の質問にも正確に回答できるようにした手法に RAG (Retrieval Augmented Generations) があります。 RAG は、大きく「レトリーバー (Retriever)」と「ジェネレーター (Generator)」の 2 つのパーツで構成されています。レトリーバーは、ユーザーによって入力されたクエリ (例…
Source
]]>
3207
-
NVIDIA AI Blueprint でカスタマー サービス向けの AI バーチャル アシスタントを作成する 3 つの構成要素
http://www.open-lab.net/ja-jp/blog/three-building-blocks-for-creating-ai-virtual-assistants-for-customer-service-with-an-nvidia-nim-agent-blueprint/
Wed, 11 Dec 2024 10:02:45 +0000
http://www.open-lab.net/ja-jp/blog/?p=3052
Reading Time: 2 minutes 今日のめまぐるしいビジネス環境では、優れたカスタマー サービスを提供することは、もはや単に「あれば良いこと」ではなく、「必要不可欠なこと」です。技術的な問題への対応、請求に関する質問の解決、サービスの最新情報の提供など、 … Continued ]]>
Reading Time: 2 minutes 今日のめまぐるしいビジネス環境では、優れたカスタマー サービスを提供することは、もはや単に「あれば良いこと」ではなく、「必要不可欠なこと」です。技術的な問題への対応、請求に関する質問の解決、サービスの最新情報の提供など、顧客は、迅速かつ正確で、顧客の都合にカスタマイズされた対応を期待しています。しかし、このレベルのサービスを実現するには、大きな課題が伴います。 パーソナライズされたリアルタイムのサポートを提供するには、多くの場合、靜的なスクリプトや手作業によるプロセスといった従來のアプローチでは不十分です。さらに、多くのカスタマー サービス業務では、機密性が高くかつ斷片的なデータを取り扱うことになり、厳しいデータ管理とプライバシー規制の対象となります。生成 AI の臺頭により、企業は運用効率の向上、コスト削減、
Source
]]>
3052
-
NVIDIA NIM でファインチューニングされた AI モデルのデプロイ
http://www.open-lab.net/ja-jp/blog/deploying-fine-tuned-ai-models-with-nvidia-nim/
Thu, 21 Nov 2024 05:34:49 +0000
http://www.open-lab.net/ja-jp/blog/?p=2953
Reading Time: 2 minutes ドメイン固有のデータで AI 基盤モデルを適応させている企業にとって、ファインチューニングされたモデルを迅速に作成し、デプロイする能力は、企業の生成 AI アプリケーションで効率的に価値を提供するための鍵となります。 N … Continued ]]>
Reading Time: 2 minutes ドメイン固有のデータで AI 基盤モデルを適応させている企業にとって、ファインチューニングされたモデルを迅速に作成し、デプロイする能力は、企業の生成 AI アプリケーションで効率的に価値を提供するための鍵となります。 NVIDIA NIM は、Parapeter-efficient Fine-tuning (PEFT) を用いてカスタマイズしたモデルのシームレスなデプロイなど、最新の AI 基盤モデル向けにビルドされたパフォーマンスを最適化した推論マイクロサービスを提供します。 場合によっては、Low-rank Adaptation (LoRA) を使用した PEFT とは異なり、継続事前學習、DPO、教師ありファインチューニング (SFT: Supervised Fine-tuning)、
Source
]]>
2953
-
2D と 3D のデジタル ヒューマン アバターによる AI エージェント インターフェイス オプションの拡張
http://www.open-lab.net/ja-jp/blog/expanding-ai-agent-interface-options-with-2d-and-3d-digital-human-avatars/
Wed, 13 Nov 2024 05:15:28 +0000
http://www.open-lab.net/ja-jp/blog/?p=3036
Reading Time: 2 minutes ユーザーが生成 AI アプリケーションを使ってやり取りする際には、テキスト、音聲、デジタル アバターなど複數のコミュニケーション オプションを利用することができます。 従來のチャットボットやコパイロット アプリケーション … Continued ]]>
Reading Time: 2 minutes ユーザーが生成 AI アプリケーションを使ってやり取りする際には、テキスト、音聲、デジタル アバターなど複數のコミュニケーション オプションを利用することができます。 従來のチャットボットやコパイロット アプリケーションでは、ユーザーが問い合わせを入力し、テキストベースの応答を受信するテキスト インターフェイスを使用しています。ハンズフリーのコミュニケーションでは、自動音聲認識 (ASR: Automatic Speech Recognition) や音聲合成 (TTS: Text-To-Speech) などの音聲 AI 技術により、電話を使用したカスタマー サービスなどのシナリオに最適な口頭によるやり取りが容易になります。さらに、デジタル アバターに音聲機能を持たせることで、ユーザーがアプリケーションを視覚的に使用できるため、
Source
]]>
3036
-
NVIDIA AI Workbench によるハイブリッド環境におけるスムーズなコラボレーションと迅速なプロトタイピング
http://www.open-lab.net/ja-jp/blog/frictionless-collaboration-and-rapid-prototyping-in-hybrid-environments-with-nvidia-ai-workbench/
Mon, 04 Nov 2024 06:49:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=2964
Reading Time: 3 minutes NVIDIA AI Workbench は、選択したシステムでデータ サイエンス、AI、機械學習 (ML) プロジェクトを合理化する無料の開発環境マネージャーです。 PC、ワークステーション、データ センター、クラウド上 … Continued ]]>
Reading Time: 3 minutes NVIDIA AI Workbench は、選択したシステムでデータ サイエンス、AI、機械學習 (ML) プロジェクトを合理化する無料の開発環境マネージャーです。 PC、ワークステーション、データ センター、クラウド上で、あるいはそれらをまたがり、スムーズな作成、計算、コラボレーションを行うことを目的としています。基本的なユーザー體験はシンプルです: この記事では、GTC 2024 での製品発表以來、最も重要な NVIDIA AI Workbench の 10 月のリリースにおけるハイライトをご紹介します。製品ビジョン実現に向けた大きな一歩です。 このセクションでは、最新リリースでの主要な新機能とユーザーから要望のあった更新について、詳しく説明します。 主な新機能には以下が含まれます。
Source
]]>
2964
-
NVIDIA NIM によるマルチモーダル ビジュアル AI エージェントの構築
http://www.open-lab.net/ja-jp/blog/build-multimodal-visual-ai-agents-powered-by-nvidia-nim/
Thu, 31 Oct 2024 08:46:59 +0000
http://www.open-lab.net/ja-jp/blog/?p=2986
Reading Time: 3 minutes 畫像から PDF、ストリーミング動畫に至るまで、ビジュアル データが指數関數的に急増しているため、手動によるレビューと分析は事実上不可能になっています。企業は、このデータを大規模に実用的な洞察に変えるのに苦労しており、そ … Continued ]]>
Reading Time: 3 minutes 畫像から PDF、ストリーミング動畫に至るまで、ビジュアル データが指數関數的に急増しているため、手動によるレビューと分析は事実上不可能になっています。企業は、このデータを大規模に実用的な洞察に変えるのに苦労しており、その結果、機會逸失やリスクの増大につながっています。 この課題を解決するために、畫像や動畫の視覚認識とテキストベースの推論を組み合わせた強力なツールとして、ビジョン言語モデル (VLM) が登場しています。テキストのみを処理する従來の大規模言語モデル (LLM) とは異なり、VLM は複雑なマルチモーダル データを理解し、それに基づいて行動するビジュアル AI エージェントを構築できるため、リアルタイムの意思決定と自動化が可能になります。 リモート カメラの映像を解析して山火事の初期兆候を検出したり、
Source
]]>
2986
-
通信會社に AI-RAN を提供
http://www.open-lab.net/ja-jp/blog/bringing-ai-ran-to-a-telco-near-you/
Tue, 08 Oct 2024 08:40:56 +0000
http://www.open-lab.net/ja-jp/blog/?p=3185
Reading Time: 5 minutes 生成 AI と AI エージェントの推論により、エッジからセントラル クラウドまで AI コンピューティング インフラストラクチャを分散する必要性が高まります。 IDC は、「ビジネス AI (消費者を除く) は、203 … Continued ]]>
Reading Time: 5 minutes 生成 AI と AI エージェントの推論により、エッジからセントラル クラウドまで AI コンピューティング インフラストラクチャを分散する必要性が高まります。 IDC は、「ビジネス AI (消費者を除く) は、2030 年までに世界経済に 19.9 兆ドルの貢獻をし、GDP の 3.5% を占めるようになる」と予測しています。 5G ネットワークも、この新しい AI トラフィックに対応するために進化しなければなりません。 同時に、通信事業者には、データのプライバシーと主権の要件を満たしながら、ネットワーク接続に依存せずにエンタープライズ AI ワークロードをホストするためのローカル AI コンピューティング インフラストラクチャになる機會があります。 ここで、
Source
]]>
3185
-
NVIDIA NIM Operator で Kubernetes の AI 推論パイプラインを管理
http://www.open-lab.net/ja-jp/blog/managing-ai-inference-pipelines-on-kubernetes-with-nvidia-nim-operator/
Mon, 30 Sep 2024 04:10:52 +0000
http://www.open-lab.net/ja-jp/blog/?p=2851
Reading Time: 2 minutes 開発者は、これは、クラウド、データ センター、クラウド、GPU により高速化されたワークステーションなど、あらゆる場所で市場投入までの時間を短縮し、生成 AI モデルのデプロイを簡素化することができる、使いやすいクラウド … Continued ]]>
Reading Time: 2 minutes 開発者は、これは、クラウド、データ センター、クラウド、GPU により高速化されたワークステーションなど、あらゆる場所で市場投入までの時間を短縮し、生成 AI モデルのデプロイを簡素化することができる、使いやすいクラウドネイティブのマイクロサービスである NVIDIA NIM マイクロサービスに大いに期待しています。 多様なユース ケースの要求に応えるため、NVIDIA は、NVIDIA NIM マイクロサービスとしてパッケージ化されたさまざまな AI モデルを市場に投入しており、生成 AI 推論ワークフローの主要な機能を実現しています。 通常の生成 AI アプリケーションでは、複數の異なる NIM マイクロサービスを統合しています。例えば、RAG パイプラインのマルチターン対話型 AI では、LLM、埋め込み、
Source
]]>
2851
人人超碰97caoporen国产