Generative AI – NVIDIA 技術ブログ
http://www.open-lab.net/ja-jp/blog
Tue, 22 Apr 2025 08:00:53 +0000
ja
hourly
1
-
Spotlight: DataStax Langflow で再現する NVIDIA AI Blueprints をマクニカの AI TRY NOW PROGRAM で検証可能に
http://www.open-lab.net/ja-jp/blog/spotlight-nvidia-ai-blueprints-reproduced-with-datastax-langflow-can-be-tried-with-macnica-ai-try-now-program/
Fri, 18 Apr 2025 00:12:57 +0000
http://www.open-lab.net/ja-jp/blog/?p=3294
Reading Time: 2 minutes 本記事は マクニカ、DataStax、NVIDIA の 3 社で共同執筆しています。 AI エージェントとは、複數の AI や Tool を組み合わせ、従來の AI ではできない複雑なタスクや複數のタスクを自律的に実行す … Continued ]]>
Reading Time: 2 minutes 本記事は マクニカ、DataStax、NVIDIA の 3 社で共同執筆しています。 AI エージェントとは、複數の AI や Tool を組み合わせ、従來の AI ではできない複雑なタスクや複數のタスクを自律的に実行するための高度なシステムです。AI エージェントは設定された環境やフィードバックを基にタスクを実行し、データの分析、意思決定の支援、問題解決など、様々なタスクを実行します。CES 2025 や GTC 2025 にて、NVIDIA の CEO Jensen Huang はこれまでの RAG のシステムを代表する Generative AI (生成 AI) から Agentic AI (エージェント型 AI) への移行、つまり様々な業界のタスクを支援できる AI エージェントの可能性を示唆し、
Source
]]>
3294
-
BioNeMo Framework で切り拓く創薬研究の未來
http://www.open-lab.net/ja-jp/blog/the-future-of-drug-discovery-pioneered-by-bionemo-framework/
Tue, 15 Apr 2025 08:19:16 +0000
http://www.open-lab.net/ja-jp/blog/?p=3248
Reading Time: 4 minutes はじめに 人工知能 (AI) の急速な進化は、さまざまな科學分野を変革しており、その中でも TechBio は、生物學と計算科學の融合 により急成長している分野です。この分野の革新を推進する強力なフレームワークの 1 つ … Continued ]]>
Reading Time: 4 minutes 人工知能 (AI) の急速な進化は、さまざまな科學分野を変革しており、その中でも TechBio は、生物學と計算科學の融合 により急成長している分野です。この分野の革新を推進する強力なフレームワークの 1 つが BioNeMo Framework です。 BioNeMo Framework は、大規模トランスフォーマー モデルを生體分子データに適用するために設計された AI プラットフォームであり、生物學的配列の解析、分子相互作用のモデリング、新規生體分子の生成を可能にします。これにより、創薬、タンパク質工學、ゲノム研究における発見が促進されます。 生物學研究 に AI を適用することで、研究者の データ解析、モデリング、予測 のアプローチが根本的に変わりました。従來の手法では計算コストが高く、
Source
]]>
3248
-
NVIDIA のフルスタック ソリューションで AI 推論のパフォーマンスを最適化
http://www.open-lab.net/ja-jp/blog/optimize-ai-inference-performance-with-nvidia-full-stack-solutions/
Thu, 10 Apr 2025 07:21:58 +0000
http://www.open-lab.net/ja-jp/blog/?p=3287
Reading Time: 2 minutes AI 搭載アプリケーションの急速な増加に伴い、開発者と AI インフラは、最先端のパフォーマンスを提供しつつ、運用の複雑さとコストを管理するという課題に直面しています。これにより、これまでにないほどの高い要求が両者に課さ … Continued ]]>
Reading Time: 2 minutes AI 搭載アプリケーションの急速な増加に伴い、開発者と AI インフラは、最先端のパフォーマンスを提供しつつ、運用の複雑さとコストを管理するという課題に直面しています。これにより、これまでにないほどの高い要求が両者に課されています。 NVIDIA は、AI 推論の可能性を再定義し、これまで以上に高速で、効率的かつスケーラブルなソリューションを提供するために、フルスタックのイノベーションを通じて開発者を支援しており、その範囲はチップ、システム、ソフトウェアにまで及びます。 6 年前、NVIDIA は、高スループットで遅延が重大な課題となる本番環境アプリケーションを構築する開発者向けに、特別設計された AI 推論サーバーの構築に著手しました。當時多くの開発者は、
Source
]]>
3287
-
リランキングモデルによる RAG の日本語検索精度の向上
http://www.open-lab.net/ja-jp/blog/rag-with-sota-reranking-model-in-japanese/
Mon, 03 Mar 2025 06:03:24 +0000
http://www.open-lab.net/ja-jp/blog/?p=3207
Reading Time: 7 minutes ChatGPT が登場して以降、多くの企業/組織にて生成 AI の活用が進んでいます。その中でも LLM (Large Language Model、大規模言語モデル) は大量の知識を學習することで幅広い分野の問題を解決 … Continued ]]>
Reading Time: 7 minutes ChatGPT が登場して以降、多くの企業/組織にて生成 AI の活用が進んでいます。その中でも LLM (Large Language Model、大規模言語モデル) は大量の知識を學習することで幅広い分野の問題を解決することができます。LLM は學習した知識には適切な回答ができるも一方で、社內ナレッジなど學習には含まれていない事がらに関する回答は得意ではありません。LLM が特定の領域の質問にも正確に回答できるようにした手法に RAG (Retrieval Augmented Generations) があります。 RAG は、大きく「レトリーバー (Retriever)」と「ジェネレーター (Generator)」の 2 つのパーツで構成されています。レトリーバーは、ユーザーによって入力されたクエリ (例…
Source
]]>
3207
-
Jetson プラットフォーム サービス 2.0 の VLM ビデオ要約マイクロサービスの紹介
http://www.open-lab.net/ja-jp/blog/introducing-the-vlm-video-summarization-microservice-on-jetson-platform-services-2-0/
Thu, 06 Feb 2025 02:31:27 +0000
http://www.open-lab.net/ja-jp/blog/?p=3152
Reading Time: 6 minutes はじめに Jetpack 6.2 のリリースと同時に Jetson プラットフォームサービス (JPS: Jetson Platform Services) がバージョン 2.0 としてアップデート リリースされました。 … Continued ]]>
Reading Time: 6 minutes Jetpack 6.2 のリリースと同時に Jetson プラットフォームサービス (JPS: Jetson Platform Services) がバージョン 2.0 としてアップデート リリースされました。これは、以前リリースされた「Metropolis Microservices on Jetson (MMJ)」の進化形であり、Jetpack 內でのマイクロサービスのネイティブ統合が強化されています。現在のリリースは JetPack 6.1 GA (BSP R36.4.0) または JetPack 6.2 (BSP R36.4.3) で動作します。 本稿では、この JPS 2.0 の概要と、その中の「VLM ビデオ要約サービス」のデモについて説明します。 今回リリースされた JPS 2.0…
Source
]]>
3152
-
NeMo Framework と Megatron-Core の特徴や最新機能を紹介した動畫コンテンツを NVOD で公開
http://www.open-lab.net/ja-jp/blog/llm-dev-deep-dive/
Thu, 06 Feb 2025 01:17:30 +0000
http://www.open-lab.net/ja-jp/blog/?p=3127
Reading Time: 2 minutes NVIDIA は 2024 年 11 月 12 日に、大規模言語モデル (LLM) の開発に取り組んでいる日本のトップクラスの研究者や開発者およそ 50 名をお招きし、NeMo Framework と Megatron- … Continued ]]>
Reading Time: 2 minutes NVIDIA は 2024 年 11 月 12 日に、大規模言語モデル (LLM) の開発に取り組んでいる日本のトップクラスの研究者や開発者およそ 50 名をお招きし、NeMo Framework と Megatron-Core の特徴や最新機能を紹介する「NVIDIA LLM Developer Deep Dive」と名付けたセミナーを NVIDIA AI Summit Japan の一環として開催しました。 今回取り上げた NeMo Framework と Megatron-Core は、生成 AI の開発や研究になくてはならないソフトウェアで、日本を含む世界中の開発者や研究者に活用されています。セミナーの內容を紹介する前に、それぞれの概要について説明します。 NeMo Framework は、
Source
]]>
3127
-
NeMo Framework で実踐する継続事前學習 – 日本語 LLM 編 –
http://www.open-lab.net/ja-jp/blog/how-to-use-continual-pre-training-with-japanese-language-on-nemo-framework/
Mon, 20 Jan 2025 04:03:28 +0000
http://www.open-lab.net/ja-jp/blog/?p=3058
Reading Time: 3 minutes 本記事では、NeMo Framework を使用して、日本語データセットで大規模言語モデル (LLM) の継続事前學習を実行する方法を説明します。 NeMo Framework とは NeMo Framework は、L … Continued ]]>
Reading Time: 3 minutes 本記事では、NeMo Framework を使用して、日本語データセットで大規模言語モデル (LLM) の継続事前學習を実行する方法を説明します。 NeMo Framework は、LLM をはじめ、生成 AI モデルを構築、カスタマイズするためのクラウドネイティブなフレームワークです。NGC 上にコンテナーが公開されており、すぐに利用を開始することができます。 NeMo Framework は、NGC 上に公開されているコンテナーを無償利用していただくこともできますが、NVIDIA AI Enterprise の対象ソフトウェアとなっているため、エンタープライズ サポートを希望される場合は NVIDIA AI Enterprise ライセンスの購入をご検討ください。
Source
]]>
3058
-
NVIDIA Jetson Orin Nano 開発者キットを「Super」に強化
http://www.open-lab.net/ja-jp/blog/nvidia-jetson-orin-nano-developer-kit-gets-a-super-boost/
Tue, 17 Dec 2024 08:52:57 +0000
http://www.open-lab.net/ja-jp/blog/?p=3261
Reading Time: 4 minutes 生成 AI の分野は急速に進化しており、新しい大規模言語モデル (LLM: Large Language Models)、視覚言語モデル (VLM: Visual Language Models)、視覚言語行動 (VLA … Continued ]]>
Reading Time: 4 minutes 生成 AI の分野は急速に進化しており、新しい大規模言語モデル (LLM: Large Language Models)、視覚言語モデル (VLM: Visual Language Models)、視覚言語行動 (VLA: Vision Language Action) モデルが日々登場しています。 この変革の時代の最先端であり続けなければならない開発者には、CUDA を用いて最適化された推論とオープンな機會學習フレームワークにより、クラウドからエッジまで最新のモデルをシームレスにデプロイできる強力なプラットフォームが必要です。 ロボティクスやマルチモーダル エージェント向けの生成 AI ワークロードの新たな応用を支援するため、NVIDIA は NVIDIA Jetson Orin Nano 開発者キットをソフトウェア…
Source
]]>
3261
-
NeMo Curator を使った日本語テキスト データのドメイン分類
http://www.open-lab.net/ja-jp/blog/domain-classification-of-japanese-text-data-using-nemo-curator/
Tue, 17 Dec 2024 03:05:44 +0000
http://www.open-lab.net/ja-jp/blog/?p=3018
Reading Time: 3 minutes NeMo Curator は、日本のソブリン LLM の構築や更新のためのデータセットを準備するために、最近、日本語をサポートする多言語ドメイン分類器をリリースしました。ドメイン固有の LLM を構築している LLM グ … Continued ]]>
Reading Time: 3 minutes NeMo Curator は、日本のソブリン LLM の構築や更新のためのデータセットを準備するために、最近、日本語をサポートする多言語ドメイン分類器をリリースしました。ドメイン固有の LLM を構築している LLM グループが 5 つ以上あり、このチュートリアルは研究者やエンジニアの方に初歩的なガイダンスをご紹介します。 金融や醫療大規模言語 GPT モデルをトレーニングするためには、領域分類モデルが必要になります。領域分類モデルは、以下の點で重要な役割を果たします。 このモデルは、ドキュメントを以下のような 27 のドメイン クラスのいずれかに分類するテキスト分類モデルです: 「アダルト」、「蕓術と娯楽」、「自動車と乗り物」、「美容とフィットネス」、「書籍と文學」、「ビジネスと工業」、
Source
]]>
3018
-
NVIDIA AI Blueprint でカスタマー サービス向けの AI バーチャル アシスタントを作成する 3 つの構成要素
http://www.open-lab.net/ja-jp/blog/three-building-blocks-for-creating-ai-virtual-assistants-for-customer-service-with-an-nvidia-nim-agent-blueprint/
Wed, 11 Dec 2024 10:02:45 +0000
http://www.open-lab.net/ja-jp/blog/?p=3052
Reading Time: 2 minutes 今日のめまぐるしいビジネス環境では、優れたカスタマー サービスを提供することは、もはや単に「あれば良いこと」ではなく、「必要不可欠なこと」です。技術的な問題への対応、請求に関する質問の解決、サービスの最新情報の提供など、 … Continued ]]>
Reading Time: 2 minutes 今日のめまぐるしいビジネス環境では、優れたカスタマー サービスを提供することは、もはや単に「あれば良いこと」ではなく、「必要不可欠なこと」です。技術的な問題への対応、請求に関する質問の解決、サービスの最新情報の提供など、顧客は、迅速かつ正確で、顧客の都合にカスタマイズされた対応を期待しています。しかし、このレベルのサービスを実現するには、大きな課題が伴います。 パーソナライズされたリアルタイムのサポートを提供するには、多くの場合、靜的なスクリプトや手作業によるプロセスといった従來のアプローチでは不十分です。さらに、多くのカスタマー サービス業務では、機密性が高くかつ斷片的なデータを取り扱うことになり、厳しいデータ管理とプライバシー規制の対象となります。生成 AI の臺頭により、企業は運用効率の向上、コスト削減、
Source
]]>
3052
人人超碰97caoporen国产