Generative AI – NVIDIA 技術ブログ

Spotlight: DataStax Langflow で再現する NVIDIA AI Blueprints をマクニカの AI TRY NOW PROGRAM で検証可能に

Fri, 18 Apr 2025 00:12:57 +0000

Reading Time: 2 minutes 本記事はマクニカ、DataStax、NVIDIA の 3 社で共同執筆しています。 AI エージェントとは、複數の AI や Tool を組み合わせ、従來の AI ではできない複雑なタスクや複數のタスクを自律的に実行するための高度なシステムです。AI エージェントは設定された環境やフィードバックを基にタスクを実行し、データの分析、意思決定の支援、問題解決など、様々なタスクを実行します。CES 2025 や GTC 2025 にて、NVIDIA の CEO Jensen Huang はこれまでの RAG のシステムを代表する Generative AI (生成 AI) から Agentic AI (エージェント型 AI) への移行、つまり様々な業界のタスクを支援できる AI エージェントの可能性を示唆し、

Source

]]>

BioNeMo Framework で切り拓く創薬研究の未來

Tue, 15 Apr 2025 08:19:16 +0000

Reading Time: 4 minutes 人工知能 (AI) の急速な進化は、さまざまな科學分野を変革しており、その中でも TechBio は、生物學と計算科學の融合により急成長している分野です。この分野の革新を推進する強力なフレームワークの 1 つが BioNeMo Framework です。 BioNeMo Framework は、大規模トランスフォーマーモデルを生體分子データに適用するために設計された AI プラットフォームであり、生物學的配列の解析、分子相互作用のモデリング、新規生體分子の生成を可能にします。これにより、創薬、タンパク質工學、ゲノム研究における発見が促進されます。生物學研究に AI を適用することで、研究者のデータ解析、モデリング、予測のアプローチが根本的に変わりました。従來の手法では計算コストが高く、

Source

]]>

NVIDIA のフルスタックソリューションで AI 推論のパフォーマンスを最適化

Thu, 10 Apr 2025 07:21:58 +0000

Reading Time: 2 minutes AI 搭載アプリケーションの急速な増加に伴い、開発者と AI インフラは、最先端のパフォーマンスを提供しつつ、運用の複雑さとコストを管理するという課題に直面しています。これにより、これまでにないほどの高い要求が両者に課されています。 NVIDIA は、AI 推論の可能性を再定義し、これまで以上に高速で、効率的かつスケーラブルなソリューションを提供するために、フルスタックのイノベーションを通じて開発者を支援しており、その範囲はチップ、システム、ソフトウェアにまで及びます。 6 年前、NVIDIA は、高スループットで遅延が重大な課題となる本番環境アプリケーションを構築する開発者向けに、特別設計された AI 推論サーバーの構築に著手しました。當時多くの開発者は、

Source

]]>

リランキングモデルによる RAG の日本語検索精度の向上

Mon, 03 Mar 2025 06:03:24 +0000

Reading Time: 7 minutes ChatGPT が登場して以降、多くの企業/組織にて生成 AI の活用が進んでいます。その中でも LLM (Large Language Model、大規模言語モデル) は大量の知識を學習することで幅広い分野の問題を解決することができます。LLM は學習した知識には適切な回答ができるも一方で、社內ナレッジなど學習には含まれていない事がらに関する回答は得意ではありません。LLM が特定の領域の質問にも正確に回答できるようにした手法に RAG (Retrieval Augmented Generations) があります。 RAG は、大きく「レトリーバー (Retriever)」と「ジェネレーター (Generator)」の 2 つのパーツで構成されています。レトリーバーは、ユーザーによって入力されたクエリ (例…

Source

]]>

Jetson プラットフォームサービス 2.0 の VLM ビデオ要約マイクロサービスの紹介

Thu, 06 Feb 2025 02:31:27 +0000

Reading Time: 6 minutes Jetpack 6.2 のリリースと同時に Jetson プラットフォームサービス (JPS: Jetson Platform Services) がバージョン 2.0 としてアップデートリリースされました。これは、以前リリースされた「Metropolis Microservices on Jetson (MMJ)」の進化形であり、Jetpack 內でのマイクロサービスのネイティブ統合が強化されています。現在のリリースは JetPack 6.1 GA (BSP R36.4.0) または JetPack 6.2 (BSP R36.4.3) で動作します。本稿では、この JPS 2.0 の概要と、その中の「VLM ビデオ要約サービス」のデモについて説明します。今回リリースされた JPS 2.0…

Source

]]>

NeMo Framework と Megatron-Core の特徴や最新機能を紹介した動畫コンテンツを NVOD で公開

Thu, 06 Feb 2025 01:17:30 +0000

Reading Time: 2 minutes NVIDIA は 2024 年 11 月 12 日に、大規模言語モデル (LLM) の開発に取り組んでいる日本のトップクラスの研究者や開発者およそ 50 名をお招きし、NeMo Framework と Megatron-Core の特徴や最新機能を紹介する「NVIDIA LLM Developer Deep Dive」と名付けたセミナーを NVIDIA AI Summit Japan の一環として開催しました。今回取り上げた NeMo Framework と Megatron-Core は、生成 AI の開発や研究になくてはならないソフトウェアで、日本を含む世界中の開発者や研究者に活用されています。セミナーの內容を紹介する前に、それぞれの概要について説明します。 NeMo Framework は、

Source

]]>

NeMo Framework で実踐する継続事前學習 – 日本語 LLM 編 –

Mon, 20 Jan 2025 04:03:28 +0000

Reading Time: 3 minutes 本記事では、NeMo Framework を使用して、日本語データセットで大規模言語モデル (LLM) の継続事前學習を実行する方法を説明します。 NeMo Framework は、LLM をはじめ、生成 AI モデルを構築、カスタマイズするためのクラウドネイティブなフレームワークです。NGC 上にコンテナーが公開されており、すぐに利用を開始することができます。 NeMo Framework は、NGC 上に公開されているコンテナーを無償利用していただくこともできますが、NVIDIA AI Enterprise の対象ソフトウェアとなっているため、エンタープライズサポートを希望される場合は NVIDIA AI Enterprise ライセンスの購入をご検討ください。

Source

]]>

NVIDIA Jetson Orin Nano 開発者キットを「Super」に強化

Tue, 17 Dec 2024 08:52:57 +0000

Reading Time: 4 minutes 生成 AI の分野は急速に進化しており、新しい大規模言語モデル (LLM: Large Language Models)、視覚言語モデル (VLM: Visual Language Models)、視覚言語行動 (VLA: Vision Language Action) モデルが日々登場しています。この変革の時代の最先端であり続けなければならない開発者には、CUDA を用いて最適化された推論とオープンな機會學習フレームワークにより、クラウドからエッジまで最新のモデルをシームレスにデプロイできる強力なプラットフォームが必要です。ロボティクスやマルチモーダルエージェント向けの生成 AI ワークロードの新たな応用を支援するため、NVIDIA は NVIDIA Jetson Orin Nano 開発者キットをソフトウェア…

Source

]]>

NeMo Curator を使った日本語テキストデータのドメイン分類

Tue, 17 Dec 2024 03:05:44 +0000

Reading Time: 3 minutes NeMo Curator は、日本のソブリン LLM の構築や更新のためのデータセットを準備するために、最近、日本語をサポートする多言語ドメイン分類器をリリースしました。ドメイン固有の LLM を構築している LLM グループが 5 つ以上あり、このチュートリアルは研究者やエンジニアの方に初歩的なガイダンスをご紹介します。金融や醫療大規模言語 GPT モデルをトレーニングするためには、領域分類モデルが必要になります。領域分類モデルは、以下の點で重要な役割を果たします。このモデルは、ドキュメントを以下のような 27 のドメインクラスのいずれかに分類するテキスト分類モデルです: 「アダルト」、「蕓術と娯楽」、「自動車と乗り物」、「美容とフィットネス」、「書籍と文學」、「ビジネスと工業」、

Source

]]>

NVIDIA AI Blueprint でカスタマーサービス向けの AI バーチャルアシスタントを作成する 3 つの構成要素

Wed, 11 Dec 2024 10:02:45 +0000

Reading Time: 2 minutes 今日のめまぐるしいビジネス環境では、優れたカスタマーサービスを提供することは、もはや単に「あれば良いこと」ではなく、「必要不可欠なこと」です。技術的な問題への対応、請求に関する質問の解決、サービスの最新情報の提供など、顧客は、迅速かつ正確で、顧客の都合にカスタマイズされた対応を期待しています。しかし、このレベルのサービスを実現するには、大きな課題が伴います。パーソナライズされたリアルタイムのサポートを提供するには、多くの場合、靜的なスクリプトや手作業によるプロセスといった従來のアプローチでは不十分です。さらに、多くのカスタマーサービス業務では、機密性が高くかつ斷片的なデータを取り扱うことになり、厳しいデータ管理とプライバシー規制の対象となります。生成 AI の臺頭により、企業は運用効率の向上、コスト削減、

Source

]]>

Generative AI – NVIDIA 技術ブログ

Spotlight: DataStax Langflow で再現する NVIDIA AI Blueprints をマクニカの AI TRY NOW PROGRAM で検証可能に

BioNeMo Framework で切り拓く創薬研究の未來

NVIDIA のフルスタック ソリューションで AI 推論のパフォーマンスを最適化

リランキングモデルによる RAG の日本語検索精度の向上

Jetson プラットフォーム サービス 2.0 の VLM ビデオ要約マイクロサービスの紹介

NeMo Framework と Megatron-Core の特徴や最新機能を紹介した動畫コンテンツを NVOD で公開

NeMo Framework で実踐する継続事前學習 – 日本語 LLM 編 –

NVIDIA Jetson Orin Nano 開発者キットを「Super」に強化

NeMo Curator を使った日本語テキスト データのドメイン分類

NVIDIA AI Blueprint でカスタマー サービス向けの AI バーチャル アシスタントを作成する 3 つの構成要素

NVIDIA のフルスタックソリューションで AI 推論のパフォーマンスを最適化

Jetson プラットフォームサービス 2.0 の VLM ビデオ要約マイクロサービスの紹介

NeMo Curator を使った日本語テキストデータのドメイン分類

NVIDIA AI Blueprint でカスタマーサービス向けの AI バーチャルアシスタントを作成する 3 つの構成要素