NVIDIA が、NVIDIA DGX SuperPOD でかつてない速さで AI ファクトリーの構築を支援

Fri, 11 Apr 2025 08:18:00 +0000

Reading Time: 2 minutes 日本國內の非公開の場所にある巨大な部屋で、デジタル革命が起こっています。サーバーラックが巨人のように立ち並び、その洗練されたフレームは無限の可能性を秘めた數千本のケーブルによって接続されています。昨年まで、この広大な AI ファクトリーは存在していませんでした。この施設は今、先進的なインフラを活用して進歩を推進し、AI と共存する社會の創造に根ざした、ソフトバンクの AI を活用したイノベーションのビジョンを支える體制を整えています。ソフトバンクにとって、導入を短縮することは単なる技術的な勝利を意味するものではありません。それは様々な競爭優位性をもたらします。AI スーパーコンピューティングの目まぐるしい世界では、スピードがすべてです。日本を代表するテクノロジ企業の 1 社であるソフトバンクは、

Source

]]>

NVIDIA のフルスタックソリューションで AI 推論のパフォーマンスを最適化

Thu, 10 Apr 2025 07:21:58 +0000

Reading Time: 2 minutes AI 搭載アプリケーションの急速な増加に伴い、開発者と AI インフラは、最先端のパフォーマンスを提供しつつ、運用の複雑さとコストを管理するという課題に直面しています。これにより、これまでにないほどの高い要求が両者に課されています。 NVIDIA は、AI 推論の可能性を再定義し、これまで以上に高速で、効率的かつスケーラブルなソリューションを提供するために、フルスタックのイノベーションを通じて開発者を支援しており、その範囲はチップ、システム、ソフトウェアにまで及びます。 6 年前、NVIDIA は、高スループットで遅延が重大な課題となる本番環境アプリケーションを構築する開発者向けに、特別設計された AI 推論サーバーの構築に著手しました。當時多くの開発者は、

Source

]]>

Newton: ロボティクスシミュレーションのためのオープンソース物理エンジンを発表

Tue, 18 Mar 2025 07:11:00 +0000

Reading Time: < 1 minute フィジカル AI モデルは、ロボットが現実世界を自律的に認識、解釈、推論し、インタラクションできるようにします。その実現には、アクセラレーテッドコンピューティングと高精度なシミュレーションが欠かせません。物理法則はロボットシミュレーションの基盤であり、現実的な環境下でのロボットの挙動や相互作用を忠実に再現するための土臺となります。これにより、開発者や研究者は、安全かつ効率的にやプロトタイプの設計やロボット制御アルゴリズムをトレーニング、テスト、検証できます。ロボットシミュレーションは、質量/運動量保存則、剛體/軟體の力學、接觸/摩擦、アクチュエーターのモデル化といった物理の基本法則に基づいて構築されています。これらの原理を使って、さまざまな環境やシナリオでのロボットの挙動を予測します。しかし、

Source

]]>

リランキングモデルによる RAG の日本語検索精度の向上

Mon, 03 Mar 2025 06:03:24 +0000

Reading Time: 7 minutes ChatGPT が登場して以降、多くの企業/組織にて生成 AI の活用が進んでいます。その中でも LLM (Large Language Model、大規模言語モデル) は大量の知識を學習することで幅広い分野の問題を解決することができます。LLM は學習した知識には適切な回答ができるも一方で、社內ナレッジなど學習には含まれていない事がらに関する回答は得意ではありません。LLM が特定の領域の質問にも正確に回答できるようにした手法に RAG (Retrieval Augmented Generations) があります。 RAG は、大きく「レトリーバー (Retriever)」と「ジェネレーター (Generator)」の 2 つのパーツで構成されています。レトリーバーは、ユーザーによって入力されたクエリ (例…

Source

]]>

NVIDIA Jetson Orin Nano 開発者キットを「Super」に強化

Tue, 17 Dec 2024 08:52:57 +0000

Reading Time: 4 minutes 生成 AI の分野は急速に進化しており、新しい大規模言語モデル (LLM: Large Language Models)、視覚言語モデル (VLM: Visual Language Models)、視覚言語行動 (VLA: Vision Language Action) モデルが日々登場しています。この変革の時代の最先端であり続けなければならない開発者には、CUDA を用いて最適化された推論とオープンな機會學習フレームワークにより、クラウドからエッジまで最新のモデルをシームレスにデプロイできる強力なプラットフォームが必要です。ロボティクスやマルチモーダルエージェント向けの生成 AI ワークロードの新たな応用を支援するため、NVIDIA は NVIDIA Jetson Orin Nano 開発者キットをソフトウェア…

Source

]]>

Megatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発

Mon, 11 Nov 2024 06:42:45 +0000

Reading Time: 2 minutes 生成 AI は、その卓越した能力のおかげで、従來の機械學習手法ではできなかったタスクを実行し、注目を集めています。例えば、自然言語処理の分野では、大規模言語モデル (LLM) が登場したことで、チャットボットによるカスタマーサポートや會議內容の要約など、これまで人間が擔っていた役割を AI が代わりに行うなど多くの革新的で創造的なユースケースが生まれています。 LLM は、パラメーター數の増加や MoE (Mixture of Experts) のような新しいアルゴリズムの採用など、様々なアプローチを通じて進化し続けており、小売業、製造業、金融業など、さまざまな業界への応用と適用が期待されています。しかし、現在 LLM リーダーボードの上位モデルの多くは、

Source

]]>

NVIDIA NeMo による最先端のマルチモーダル生成 AI モデル開発

Wed, 06 Nov 2024 12:55:44 +0000

Reading Time: 2 minutes 生成 AI は、テキストベースのモデルからマルチモーダル機能へと急速に進化しています。これらのモデルは、畫像のキャプション作成や視覚的な質問回答などのタスクを実行し、より人間に近い AI へとシフトしていることを反映しています。このコミュニティは現在、テキストや畫像から動畫へと拡大しており、さまざまな業界で新たな可能性を切り開かれています。動畫 AI モデルは、ロボティクス、自動車、小売などの業界に革命を起こそうとしています。ロボティクスでは、製造業や倉庫管理などの分野に不可欠な、複雑で変化し続ける環境における自律的なナビゲーションを強化しています。自動車業界では、動畫 AI が自動運転を推進し、車両の認識、安全性、予知保全を強化し、効率性を高めています。畫像や動畫の基盤モデルを構築するには、

Source

]]>

NVIDIA GH200 Superchip が、Llama モデルとのマルチターンインタラクションの推論を 2 倍高速化

Mon, 28 Oct 2024 07:26:00 +0000

Reading Time: 2 minutes 本番環境で大規模言語モデル (LLM) をデプロイする際に、ユーザーのインタラクティブ性の強化と、システムのスループット向上との間で難しいトレードオフを迫られることがよくあります。ユーザーのインタラクティブ性を強化するには、最初のトークンが出力されるまでの時間 (TTFT: Time To First Token) を最小限に抑える必要がありますが、スループットを向上するには、1 秒あたりのトークン數を増やす必要があります。一方の側面を改善すると、もう一方の側面が悪化することが多いため、データセンター、クラウドサービスプロバイダー (CSP)、AI アプリケーションプロバイダーにとって、適切なバランスを見つけることが困難になっています。 NVIDIA GH200 Grace Hopper Superchip を活用すると、

Source

]]>

先進的なソブリン AI モデルが、日本のイノベーションとチャンスを解き放つ

Wed, 09 Oct 2024 02:58:12 +0000

Reading Time: 2 minutes ソブリン AI モデルは、特定の文化的や言語的ニュアンスに合わせて調整されているため、文脈を理解し適切な応答を生成する上でより効果的です。さらに、これらのモデルは地域のイノベーションを支援し、各國がそれぞれのニーズや優先事項に沿った AI 技術を開発することを可能にします。その結果、世界各國から支持されるソブリン AI モデルを開発しようという動きが高まっています。実際に、各國政府は、研究者や企業が自國民のニーズに特化した AI システムを構築できるようにするための構想を開始し、計算インフラに予算を割り當てています。このたび、東京科學大學 (舊?東京工業大學) と産業技術総合研究所 (AIST)は、Llama 3.1 をベースに、日本特有の言語的/

Source

]]>

高速化された Llama 3.2 をエッジからクラウドへデプロイする

Wed, 25 Sep 2024 08:25:00 +0000

Reading Time: 2 minutes オープンソースの Meta Llama モデルのコレクションを拡張した Llama 3.2 コレクションには、視覚言語モデル (VLM)、小規模言語モデル (SLM)、ビジョンのサポートが追加された Llama Guard モデルが含まれています。NVIDIA のアクセラレーテッドコンピューティングプラットフォームと組み合わせることで、Llama 3.2 は開発者、研究者、企業に、生成 AI のユースケースを実現するための有益な新機能と最適化を提供します。 NVIDIA H100 Tensor コア GPU でトレーニングされた 1B および 3B サイズの SLM は、エッジデバイスに Llama ベースの AI アシスタントを展開するのに最適です。11B および 90B サイズの VLM は、

Source

]]>

Top Stories – NVIDIA 技術ブログ

NVIDIA が、NVIDIA DGX SuperPOD でかつてない速さで AI ファクトリーの構築を支援

NVIDIA のフルスタック ソリューションで AI 推論のパフォーマンスを最適化

Newton: ロボティクス シミュレーションのためのオープンソース物理エンジンを発表

リランキングモデルによる RAG の日本語検索精度の向上

NVIDIA Jetson Orin Nano 開発者キットを「Super」に強化

Megatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発

NVIDIA NeMo による最先端のマルチモーダル生成 AI モデル開発

NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化

先進的なソブリン AI モデルが、日本のイノベーションとチャンスを解き放つ

高速化された Llama 3.2 をエッジからクラウドへデプロイする

NVIDIA のフルスタックソリューションで AI 推論のパフォーマンスを最適化

Newton: ロボティクスシミュレーションのためのオープンソース物理エンジンを発表

NVIDIA GH200 Superchip が、Llama モデルとのマルチターンインタラクションの推論を 2 倍高速化