Data Science – NVIDIA 技術ブログ
http://www.open-lab.net/ja-jp/blog
Mon, 03 Mar 2025 09:08:47 +0000
ja
hourly
1
-
LLM テクニックの習得: データの前処理
http://www.open-lab.net/ja-jp/blog/mastering-llm-techniques-data-preprocessing/
Wed, 13 Nov 2024 08:15:16 +0000
http://www.open-lab.net/ja-jp/blog/?p=2943
Reading Time: 2 minutes 大規模言語モデル (LLM) の出現は、企業が AI を活用して業務とサービスを強化する方法に大きな変化をもたらしました。LLM は日常的な作業を自動化し、プロセスを合理化することで、人的リソースをより戦略的な取り組みに … Continued ]]>
Reading Time: 2 minutes 大規模言語モデル (LLM) の出現は、企業が AI を活用して業務とサービスを強化する方法に大きな変化をもたらしました。LLM は日常的な作業を自動化し、プロセスを合理化することで、人的リソースをより戦略的な取り組みに割り當てることで、全體的な効率性と生産性を向上させます。 LLM を高精度にトレーニングおよびカスタマイズするには、高品質なデータが必要となるため、多くの課題を伴います。データの質が低く、量が十分でないと、モデルの精度が大幅に低下する可能性があるため、AI 開発者にとってデータセットの準備は重要な作業の 1 つとなっています。 データセットには往々にして重複したドキュメント、個人を特定できる情報 (PII)、フォーマットに関する問題が存在します。データセットの中には、
Source
]]>
2943
-
NVIDIA TensorRT-LLM の KV Cache Early Reuseで、Time to First Token を 5 倍高速化
http://www.open-lab.net/ja-jp/blog/5x-faster-time-to-first-token-with-nvidia-tensorrt-llm-kv-cache-early-reuse/
Fri, 08 Nov 2024 05:57:27 +0000
http://www.open-lab.net/ja-jp/blog/?p=3095
Reading Time: 2 minutes 以前のブログ記事では、key-value (KV) キャッシュを CPU メモリにオフロードして再利用することで、最初のトークンが出力されるまでの時間 (TTFT: Time To First Token) を x86 … Continued ]]>
Reading Time: 2 minutes 以前のブログ記事では、key-value (KV) キャッシュを CPU メモリにオフロードして再利用することで、最初のトークンが出力されるまでの時間 (TTFT: Time To First Token) を x86 ベースの NVIDIA H100 Tensor コア GPU で最大 14 倍、NVIDIA GH200 Superchip で最大 28 倍に高速化できる方法をご紹介しました。本記事では、KV キャッシュの再利用技術と、TTFT のさらなる高速化を実現するベストプラクティスについて解説します。 LLM モデルは、質問回答やコード生成など、多くのタスクで急速に採用されています。応答を生成するにあたり、これらのモデルはまず、ユーザーのプロンプトをトークンへ変換し、
Source
]]>
3095
-
NVIDIA AI Workbench によるハイブリッド環境におけるスムーズなコラボレーションと迅速なプロトタイピング
http://www.open-lab.net/ja-jp/blog/frictionless-collaboration-and-rapid-prototyping-in-hybrid-environments-with-nvidia-ai-workbench/
Mon, 04 Nov 2024 06:49:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=2964
Reading Time: 3 minutes NVIDIA AI Workbench は、選択したシステムでデータ サイエンス、AI、機械學習 (ML) プロジェクトを合理化する無料の開発環境マネージャーです。 PC、ワークステーション、データ センター、クラウド上 … Continued ]]>
Reading Time: 3 minutes NVIDIA AI Workbench は、選択したシステムでデータ サイエンス、AI、機械學習 (ML) プロジェクトを合理化する無料の開発環境マネージャーです。 PC、ワークステーション、データ センター、クラウド上で、あるいはそれらをまたがり、スムーズな作成、計算、コラボレーションを行うことを目的としています。基本的なユーザー體験はシンプルです: この記事では、GTC 2024 での製品発表以來、最も重要な NVIDIA AI Workbench の 10 月のリリースにおけるハイライトをご紹介します。製品ビジョン実現に向けた大きな一歩です。 このセクションでは、最新リリースでの主要な新機能とユーザーから要望のあった更新について、詳しく説明します。 主な新機能には以下が含まれます。
Source
]]>
2964
-
NVIDIA cuOpt で大規模な線形計畫問題を加速する
http://www.open-lab.net/ja-jp/blog/accelerate-large-linear-programming-problems-with-nvidia-cuopt/
Tue, 08 Oct 2024 07:57:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=2974
Reading Time: 3 minutes 線形計畫法 (LP: Linear Programming) ソルバーの進化は、シンプレックス法から內點法 (IPM: Interior Point Method) まで、過去 1 世紀にわたってに重要な節目で特徴づけら … Continued ]]>
Reading Time: 3 minutes 線形計畫法 (LP: Linear Programming) ソルバーの進化は、シンプレックス法から內點法 (IPM: Interior Point Method) まで、過去 1 世紀にわたってに重要な節目で特徴づけられてきました。主雙対線形計畫法 (PDLP: Primal-dual Linear Programming) の導入は、さらなる大きな進歩をもたらしました。 NVIDIA cuOpt は現在、GPU アクセラレーションで PDLP を実裝しています。最先端のアルゴリズム、NVIDIA ハードウェア、専用の CUDA 機能、NVIDIA GPU ライブラリを使用して、cuOpt LP ソルバーは、CPU ベースのソルバーと比較して 5,000 倍以上の高速パフォーマンスを実現しています。 この投稿では、
Source
]]>
2974
-
NVIDIA cuOpt でルート最適化に革命を起こす
http://www.open-lab.net/ja-jp/blog/revolutionizing-route-optimization-with-nvidia-cuopt/
Fri, 12 Jul 2024 02:11:13 +0000
http://www.open-lab.net/ja-jp/blog/?p=2706
Reading Time: 2 minutes NVIDIA cuOpt? は、世界記録を持つ GPU 対応最適化 AI マイクロサービスであり、複數の制約がある複雑なルーティング問題をチームで解決する際に役立ちます。cuOpt では、GPU で高速化する進化したアル … Continued ]]>
Reading Time: 2 minutes NVIDIA cuOpt は、世界記録を持つ GPU 対応最適化 AI マイクロサービスであり、複數の制約がある複雑なルーティング問題をチームで解決する際に役立ちます。cuOpt では、GPU で高速化する進化したアルゴリズムが使用され、ヒューリスティックス、メタヒューリスティックス、最適化を利用し、多様で制約のある複雑な車両経路問題を計算します。?比類のない精度、ソルバー対応時間、拡張性を備えた cuOpt は、事業をかつてないほどに最適化するパワーを企業に與えます。 NVIDIA AI Enterprise の一部となった cuOpt は、クラウド、オンプレミス、ハイブリッドを問わず、どこにでもデプロイすることができます。非対稱パターンの距離行列と時間行列をサポートしているため、
Source
]]>
2706
-
本番環境への AI モデルのデプロイを効率化する NVIDIA NIM
http://www.open-lab.net/ja-jp/blog/nvidia-nim-offers-optimized-inference-microservices-for-deploying-ai-models-at-scale/
Mon, 15 Apr 2024 06:17:39 +0000
http://www.open-lab.net/ja-jp/blog/?p=2381
Reading Time: 2 minutes 生成 AI を導入する動きの高まりには目覚ましいものがあります。2022 年に OpenAI がリリースした ChatGPT をきっかけに、たった數か月の間に 1 億人以上のユーザーがこの新しいテクノロジを使い始め、ほぼ … Continued ]]>
Reading Time: 2 minutes 生成 AI を導入する動きの高まりには目覚ましいものがあります。2022 年に OpenAI がリリースした ChatGPT をきっかけに、たった數か月の間に 1 億人以上のユーザーがこの新しいテクノロジを使い始め、ほぼすべての業界にわたり開発活動が活発になりました。 2023 年までに、開発者たちは Meta、Mistral、Stability などが提供する API やオープンソースのコミュニティ モデルを使った概念実証を始めました。 2024 年に入り、組織は、AI モデルを既存の企業インフラに接続し、システムのレイテンシとスループットを最適化し、ロギング、モニタリング、セキュリティなどを含む、本格的な本番環境へのデプロイに重點を移行しつつあります。このような本番環境へのデプロイの道のりは、複雑で時間がかかります。
Source
]]>
2381
-
記録を塗り替え続ける NVIDIA cuOpt アルゴリズムがルート最適化ソリューションを 100 倍高速化
http://www.open-lab.net/ja-jp/blog/record-breaking-nvidia-cuopt-algorithms-deliver-route-optimization-solutions-100x-faster/
Wed, 20 Mar 2024 06:05:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=2693
Reading Time: 3 minutes NVIDIA cuOpt は、複雑なルーティング問題を解決するための高速最適化エンジンです。休憩時間、待ち時間、車両の複數のコスト/時間マトリックス、複數の目標、注文と車両のマッチング、車両の開始位置と終了位置、車両の開 … Continued ]]>
Reading Time: 3 minutes NVIDIA cuOpt は、複雑なルーティング問題を解決するための高速最適化エンジンです。休憩時間、待ち時間、車両の複數のコスト/時間マトリックス、複數の目標、注文と車両のマッチング、車両の開始位置と終了位置、車両の開始時間と終了時間など、さまざまな側面が含まれる問題を効率的に解決します。 具體的には、cuOpt は 2 つの問題の複數のバリアントを解決します。CVRPTW (容量制約と時間枠のある配送計畫問題) と PDPTW (時間枠のある集荷と配達の問題) です。これらの問題の目的は、それぞれの注文において車両數と走行距離合計を最小限に抑えつつ、顧客の依頼にサービスを提供することです。 cuOpt は、SINTEF が検証した最大規模のルーティング ベンチマークにおいて、過去 3 年間で、23…
Source
]]>
2693
-
RAG アプリケーションを 4 つのステップでパイロットから本番環境に移行する方法
http://www.open-lab.net/ja-jp/blog/how-to-take-a-rag-application-from-pilot-to-production-in-four-steps/
Mon, 18 Mar 2024 03:00:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=2625
Reading Time: 3 minutes 生成 AI はあらゆる産業を変革する可能性を秘めています。私たちは、困難な認知作業を説明し、論理的に推論し、解決する目的ですでに大規模言語モデル (LLM) を使用しています。検索拡張生成 (RAG) は LLM をデー … Continued ]]>
Reading Time: 3 minutes 生成 AI はあらゆる産業を変革する可能性を秘めています。私たちは、困難な認知作業を説明し、論理的に推論し、解決する目的ですでに大規模言語モデル (LLM) を使用しています。検索拡張生成 (RAG) は LLM をデータに接続し、LLM が最新の正確な情報にアクセスできるようにすることで LLM の利便性をさらに高めます。 多くの企業がすでに RAG で業務プロセスを自動化し、データからインサイトを発掘する方法を探り始めています。ほとんどの企業が生成 AI のユース ケースに合わせた複數のパイロットプロジェクトを始めていますが、そのほとんど (90%) は近い將來に評価フェーズから先に進むことはないと推定されています。人々を惹きつける RAG のデモを、真のビジネス価値を提供する本番環境サービスに変換することは、
Source
]]>
2625
-
NVIDIA cuOpt の高速最適化を體験し運用効率を向上
http://www.open-lab.net/ja-jp/blog/experience-nvidia-cuopt-accelerated-optimization-to-boost-operational-efficiency/
Mon, 19 Feb 2024 05:02:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=2671
Reading Time: 2 minutes このモデル リリースでは、NVIDIA cuOpt を特集しています。これは記録破りに高速化された最適化エンジンであり、チームが複雑な経路問題を解決し、新しい機能を実行するために役立ちます。組織はこのエンジンを利用するこ … Continued ]]>
Reading Time: 2 minutes このモデル リリースでは、NVIDIA cuOpt を特集しています。これは記録破りに高速化された最適化エンジンであり、チームが複雑な経路問題を解決し、新しい機能を実行するために役立ちます。組織はこのエンジンを利用することで、物流、業務調査、輸送、サプライ チェーンの最適化を再創造できます。 NVIDIA cuOpt は、次のような物流の最適化におけるさまざまなユース ケースに役立っています。 cuOpt は最終的に、組織の収益増加、コスト削減、顧客満足度改善を支援します。 この記事では、cuOpt の機能を探る 2 つの方法について説明します。NVIDIA AI Foundation モデルとエンドポイントと NVIDIA LaunchPad です。
Source
]]>
2671
-
RAPIDS cuDF、コード変更ゼロで pandas を約 150 倍高速化
http://www.open-lab.net/ja-jp/blog/rapids-cudf-accelerates-pandas-nearly-150x-with-zero-code-changes/
Wed, 08 Nov 2023 08:10:56 +0000
http://www.open-lab.net/ja-jp/blog/?p=2164
Reading Time: 2 minutes NVIDIA は、RAPIDS cuDF が 950 萬人の pandas ユーザーに、コードを変更することなく GPU アクセラレーションを提供できるようになったと発表しました。 pandas は、Python 用の柔 … Continued ]]>
Reading Time: 2 minutes NVIDIA は、RAPIDS cuDF が 950 萬人の pandas ユーザーに、コードを変更することなく GPU アクセラレーションを提供できるようになったと発表しました。 NVIDIA が先日開催した AI and Data Science Virtual Summit の「基調講演の動畫 (英語)」をご覧ください。 pandas は、Python 用の柔軟かつパワフルなデータ解析およびデータ操作ライブラリです。API を容易に使用できることから、データ サイエンティストには最高の選択肢と言えます。ただし CPU のみのシステムでは、データセットのサイズが大きくなるほど処理速度と効率が低下します。 RAPIDS は、
Source
]]>
2164
人人超碰97caoporen国产