RAPIDS
RAPIDS? ã¯ã€æœ€ã‚‚広ã使用ã•れã¦ã„るオープンソース データ ツール群ã¨äº’æ›æ€§ã®ã‚ã‚‹ API ã‚’å‚™ãˆãŸã€GPU ã§é«˜é€ŸåŒ–ã•れãŸãƒ‡ãƒ¼ã‚¿ サイエンスãŠã‚ˆã³ AI ライブラリã®ã‚ªãƒ¼ãƒ—ンソース スイートã§ã™ã€‚データ パイプライン全體ã«ã‚ãŸã‚Šãƒ‘フォーマンスをæ¡é•ã„ã§å¤§è¦æ¨¡ã«é«˜é€ŸåŒ–ã§ãã¾ã™ã€‚
今ã™ãå§‹ã‚ã‚‹
RAPIDS ã®ãƒ¡ãƒªãƒƒãƒˆ
大幅ãªé«˜é€ŸåŒ–
パイプラインãŒé«˜é€ŸåŒ–ã•れるã¨ã€ã‚ˆã‚Šå¤šãã®å®Ÿé¨“ãŒå¯èƒ½ã¨ãªã‚Šã€æˆæžœãŒå‘上ã—ã¾ã™ã€‚
ベンãƒãƒžãƒ¼ã‚¯ã‚’実行ã—ã¦ã¿ã‚‹
å°Žå…¥ã—ã‚„ã™ã„
ä½¿ã„æ…£ã‚ŒãŸ Python API ã¨ãƒ—ラグインã«ã‚ˆã‚Šã€æ—¢å˜ã®ãƒ¯ãƒ¼ã‚¯ãƒãƒ¼ãƒ‰ãŒã™ãã«é«˜é€ŸåŒ–ã•れã¾ã™ã€‚
モジュールå¼ãƒ©ã‚¤ãƒ–ラリã«ã¤ã„ã¦
柔軟ãªã‚ªãƒ¼ãƒ—ンソース プラットフォーãƒ
100 以上ã®ã‚½ãƒ•トウェアã¨çµ±åˆã™ã‚‹ã“ã¨ã§ã€RAPIDS ã¯ã‚³ãƒ©ãƒœãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã‚’促進ã—ã¾ã™ã€‚
エコシステムã«ã¤ã„ã¦
ã©ã“ã§ã‚‚実行å¯èƒ½
RAPIDS ã¯ã€ã™ã¹ã¦ã®å¤§æ‰‹ã‚¯ãƒ©ã‚¦ãƒ‰ã€ãƒãƒ¼ã‚«ãƒ« マシンã€ã¾ãŸã¯ã‚ªãƒ³ãƒ—レミスã§å®Ÿè¡Œå¯èƒ½ã§ã™ã€‚
導入オプションを見る
データ サイエンスを高速化
RAPIDS ã«ã¯åºƒãé©ç”¨ã•れã¦ã„ã‚‹æ“作やアルゴリズムを高速化ã™ã‚‹ãƒ©ã‚¤ãƒ–ラリãŒå‚™ã‚ã£ã¦ãŠã‚Šã€è³ªå•ãŒé€²åŒ–ã—ã¦ã‚‚洞察をç²å¾—ã™ã‚‹ã¾ã§ã®æ™‚é–“ãŒçŸç¸®ã•れã¾ã™ã€‚
150 å€
cuDF ã§ pandas ãŒé«˜é€ŸåŒ–
*Groupy ã®é«˜åº¦ãªæ“作ã«é–¢ã™ã‚‹ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ (5GB) DuckDB データ ベンãƒãƒžãƒ¼ã‚¯ HW: Intel Xeon Platinum 8480CL CPU ãŠã‚ˆã³ NVIDIA Grace Hopper GPU SW: pandas v1.5 ãŠã‚ˆã³ cudf.pandas v23.10
50 å€
cuML ã«ã‚ˆã‚Š Scikit-Learn ãŒé«˜é€ŸåŒ–
*100,000 ã®ã‚µãƒ³ãƒ—ルãŠã‚ˆã³ 256 機能ã§ã® UMAP ã®æ•™å¸«ãªã—ベンãƒãƒžãƒ¼ã‚¯ HW: Intel Xeon Platinum 8480CL CPU ãŠã‚ˆã³ NVIDIA H100 80GB (1x GPU) SW: scikit-learn v1.3 ãŠã‚ˆã³ cuML v23.10
48 å€
cuGraph ã«ã‚ˆã‚Š NetworkX ãŒé«˜é€ŸåŒ–
*16,384 以下ã®é ‚點㨠524,288 以下ã®ã‚¨ãƒƒã‚¸ã‚’æŒã¤åˆæˆãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’使用ã—㟠PageRank ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ HW: Intel Xeon Platinum 8480CL CPU ãŠã‚ˆã³ NVIDIA H100 80GB (1x GPU) SW: NetworkX v3.2 ãŠã‚ˆã³ cuGraph v23.10
rapids.ai ã§ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã‚’ã”覧ãã ã•ã„
データワークãƒãƒ¼ãƒ‰å…¨é«”ã«å¯¾ã™ã‚‹æŸ”軟性
RAPIDS ã¯ã€ãƒ¢ã‚¸ãƒ¥ãƒ¼ãƒ«å¼ã§ç›¸äº’é‹ç”¨å¯èƒ½ãªãƒ©ã‚¤ãƒ–ラリã‹ã‚‰ç¨è‡ªã«é¸æŠžã§ãã€ãƒ‘イプラインやアプリケーションã«ã‚¹ãƒ ーズã«ãƒ—ラグ アンド プレイã§ãã‚‹ãŸã‚ã€é–‹ç™ºãƒ—ãƒã‚»ã‚¹ãŒç°¡ç´ 化ã•れã¾ã™ã€‚
RAPIDS ã¯ã€ã©ã‚“ãªè¦æ¨¡ã«ãŠã„ã¦ã‚‚データ サイエンス パイプラインã®ã‚¹ãƒ ーズãªå®Ÿè¡Œã‚’ç¶æŒã—ã¾ã™ã€‚
データ準備
æ—¢å˜ã®ãƒ„ールを使用ã—ã¦ã€è¡¨å½¢å¼ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã€ã‚°ãƒ©ãƒ• データベースã€ã¾ãŸã¯ Spark フレームワークã®ãƒ‡ãƒ¼ã‚¿åˆ†æžã‚’シームレスã«é«˜é€ŸåŒ–ã—ã¾ã™ã€‚
アクセラレーテッド データ分æžã®
詳細ã¯ã“ã¡ã‚‰
機械å¸ç¿’
scikit-learn ã«åŽ³å¯†ã«æº–æ‹ ã—㟠API を使用ã—ã¦ã€ãƒ¢ãƒ‡ãƒ«ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°é€Ÿåº¦ã‚’å‘上ã•ã›ã¾ã™ã€‚
機械å¸ç¿’ã®
詳細ã¯ã“ã¡ã‚‰
ディープ ラーニング
DGL 㨠PyG ã«ã‚ˆã‚Šã€ã‚°ãƒ©ãƒ• ニューラル ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯ã®åŠ¹çŽ‡çš„ãªãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚’サãƒãƒ¼ãƒˆã—ã¾ã™ã€‚
ディープ ラーニングã®è©³ç´°ã¯ã“ã¡ã‚‰
MLOps
cuML 㨠NVIDIA Triton? ã«ã‚ˆã‚Šã€ãƒã‚¤ãƒ‘フォーマンス機械å¸ç¿’推論を展開ã—ã¾ã™ã€‚
推論ã¨å±•é–‹ã«ã¤ã„ã¦ã®
詳細ã¯ã“ã¡ã‚‰
一般ã«åˆ©ç”¨ã•れã¦ã„るオープンソース データ ツールã‹ã‚‰ã‚¤ãƒ³ã‚¹ãƒ”レーションを得ã¦ã€RAPIDS ライブラリã¯ãŠä½¿ã„ã®ãƒ¯ãƒ¼ã‚¯ãƒ•ãƒãƒ¼ã«é©å¿œã—ã¾ã™ã€‚
データã®å‰å‡¦ç†: cuDF
pandas API を使用ã—ãªãŒã‚‰ã€ GPU ã§é«˜é€ŸåŒ–ã•れ㟠DataFrames を利用ã—ã¦ã€ã‚¢ã‚¯ã‚»ãƒ©ãƒ¬ãƒ¼ãƒ†ãƒƒãƒ‰ データ サイエンスを開始ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚
ドã‚ュメントã§è©³ç´°ã‚’確èªã™ã‚‹
ãƒ“ãƒƒã‚°ãƒ‡ãƒ¼ã‚¿å‡¦ç† :RAPIDS Accelerator for Apache Spark
最å°é™ã®ã‚³ãƒ¼ãƒ‰å¤‰æ›´ã§æ—¢å˜ã® Apache Spark アプリケーションを高速化ã—ã¾ã™ã€‚
GPU-Accelerated Spark ã®è©³ç´°ã¯ã“ã¡ã‚‰ GitHub ã«ã‚¢ã‚¯ã‚»ã‚¹
機械å¸ç¿’: cuML
scikit-learn API ã«åŽ³å¯†ã«æº–æ‹ ã—㟠API を使用ã—ã¦ã€CPU 㨠GPU ã§æ©Ÿæ¢°å¸ç¿’アルゴリズムを実行ã—ã¾ã™ã€‚
ドã‚ュメントã§è©³ç´°ã‚’確èªã™ã‚‹
グラフ分æž: cuGraph
NetworkX ã«æº–æ‹ ã—㟠Python API を使用ã—ã¦ã€ã‚°ãƒ©ãƒ•分æžãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚’è¿…é€Ÿã«æ“作ã§ãã¾ã™ã€‚
ドã‚ュメントã§è©³ç´°ã‚’確èªã™ã‚‹
ベクトル検索: RAFT
RAFT ã®ãƒ—リミティブをé©ç”¨ã—ã¦ã€ãƒ™ã‚¯ãƒˆãƒ«æ¤œç´¢ã‚’å«ã‚€æ©Ÿæ¢°å¸ç¿’ã®ä¸€èˆ¬çš„ãªã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ を高速化ã—ã¾ã™ã€‚
ドã‚ュメントã§è©³ç´°ã‚’確èªã™ã‚‹
RAPIDS ã®ã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°: Dask-RAPIDS
RAPIDS on Dask ã§ã€ãƒ‡ãƒ¼ã‚¿ サイエンス パイプラインを複數ã®ãƒŽãƒ¼ãƒ‰ã«æ‹¡å¼µã—ã¾ã™ã€‚
GitHub ã«ã‚¢ã‚¯ã‚»ã‚¹
ビジュアライゼーション: cu-x-filter
1 億行を超ãˆã‚‹è¡¨å½¢å¼ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®å¤šæ¬¡å…ƒãƒ•ィルタリングã«ã‚ˆã£ã¦ã€ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–ãªãƒ‡ãƒ¼ã‚¿ ビジュアルを作æˆã—ã¾ã™ã€‚
ドã‚ュメントã§è©³ç´°ã‚’確èªã™ã‚‹
ç•«åƒ: cuCIM
n 次元畫åƒã€ç‰¹ã«ç”Ÿç‰©é†«å¸ç•«åƒã®å…¥å‡ºåŠ› (IO)ã€ã‚³ãƒ³ãƒ”ューター ビジョンã€ç•«åƒå‡¦ç†ã‚’高速化ã—ã¾ã™ã€‚
ドã‚ュメントã§è©³ç´°ã‚’確èªã™ã‚‹
専用㮠NVIDIA フレームワークã¨ã‚¬ã‚¤ãƒ‰ã‚’活用ã—ã¦ã€ä¸€èˆ¬çš„ã§å½±éŸ¿åŠ›ã®å¤§ãã„ユースケースå‘ã‘ã«é«˜é€ŸåŒ–ã•れãŸã‚¢ãƒ—リケーションを構築ã—ã¾ã™ã€‚
データ エンジニアリング
RAPIDS Accelerator for Spark ã§ãƒ‡ãƒ¼ã‚¿ç®¡ç†ã¨äº‹å‰å‡¦ç†ã«é©æ–°ã‚’ã‚‚ãŸã‚‰ã—ã¾ã™ã€‚
スケーリングã•れãŸãƒ‡ãƒ¼ã‚¿å‡¦ç†ã®è©³ç´°ã¯ã“ã¡ã‚‰
時系列予測
特徴エンジニアリングã‹ã‚‰äºˆæ¸¬ã¾ã§æ™‚系列モデリングを高速化ã—ã¾ã™ã€‚
時系列予測ã®è©³ç´°ã¯ã“ã¡ã‚‰
レコメンデーション システãƒ
NVIDIA Merlin? ã§é«˜æ€§èƒ½ã®ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ€ãƒ¼ ã‚·ã‚¹ãƒ†ãƒ ã‚’å¤§è¦æ¨¡ã«æ§‹ç¯‰ã—ã¾ã™ã€‚
レコメンダーã®è©³ç´°ã¯ã“ã¡ã‚‰
AI サイãƒãƒ¼ã‚»ã‚ュリティ
最é©åŒ–ã•れ㟠AI パイプラインã§ãƒªã‚¢ãƒ«ã‚¿ã‚¤ãƒ データをフィルターã€å‡¦ç†ã€åˆ†é¡žã—ã€ã‚µã‚¤ãƒãƒ¼è„…å¨ã‚’ã™ãã«æ¤œå‡ºã—ã¾ã™ã€‚
AI サイãƒãƒ¼ã‚»ã‚ュリティã®è©³ç´°ã¯ã“ã¡ã‚‰
高速化ã•ã‚ŒãŸæœ€é©åŒ–
世界記録をæŒã¤ cuOpt ã®ã‚¢ã‚¯ã‚»ãƒ©ãƒ¬ãƒ¼ãƒ†ãƒƒãƒ‰ ソルãƒãƒ¼ã¯ã€ãƒ©ã‚¹ãƒˆãƒ¯ãƒ³ãƒžã‚¤ãƒ«ã®é…é€ã€æŠ€è¡“è€…ã®æ´¾é£ã€ã¾ãŸã¯å·¥å ´å…§ã®ç‰©æµã«ãŠã„ã¦ãƒ«ãƒ¼ãƒˆã‚’最é©åŒ–ã—ã¾ã™ã€‚
ルート最é©åŒ–ã®è©³ç´°ã¯ã“ã¡ã‚‰
RAPIDS ã¯ã€ãƒ“ジãƒã‚¹ã‚¯ãƒªãƒ†ã‚£ã‚«ãƒ«ãªã‚¢ãƒ—リケーションã®é«˜é€ŸåŒ–ã‚’å¾—æ„ã¨ã—ã¦ãŠã‚Šã€æ¥ç•Œå…¨é«”ã§è¨ˆç•«ã‚„開発ã«ã‹ã‹ã‚‹å¹´æ•¸ã‚’çŸç¸®ã—ã¾ã™ã€‚
å°å£²
åŠ é€ŸåŒ–ã•れãŸãƒ‡ãƒ¼ã‚¿ サイエンスã«ã‚ˆã‚Šã€å°å£²æ¥å‘ã‘ã®å°å£²äºˆæ¸¬ã€ãƒ‡ãƒ¼ã‚¿åˆ†æžãªã©ãŒæ”¹å–„ã•れã¾ã™ã€‚
詳細ã¯ã“ã¡ã‚‰
金èž
リアルタイムデータã¯ã€æ™‚é–“ãŒéžå¸¸ã«é‡è¦ãªæ¥ç•Œã§ä¸æ£è¡Œç‚ºã®æ¤œå‡ºã¨äºˆæ¸¬ã‚’強化ã—ã¾ã™ã€‚
詳細ã¯ã“ã¡ã‚‰
活気ã®ã‚るエコシステãƒ
RAPIDS ã¯ã€100 ã‚’è¶…ãˆã‚‹ã‚ªãƒ¼ãƒ—ンソースãŠã‚ˆã³å•†ç”¨ã‚½ãƒ•トウェアã®çµ±åˆã«ã‚ˆã‚Šã€å”調的ãªé«˜æ€§èƒ½ãƒ‡ãƒ¼ã‚¿ サイエンス エコシステムã®åŸºç›¤ã¨ãªã‚Šã¾ã™ã€‚
當社ã¯ã€ã‚ªãƒ¼ãƒ—ンソース コミュニティã®ãƒ‡ãƒ¼ã‚¿ サイエンスã®ç°¡ç´ 化ã€çµ±åˆã€åŠ é€Ÿã«å–り組んã§ã„ã¾ã™ã€‚
RAPIDS ã¯åºƒã使ã‚れã¦ã„るデータ サイエンスãŠã‚ˆã³æ©Ÿæ¢°å¸ç¿’ãƒ—ãƒ©ãƒƒãƒˆãƒ•ã‚©ãƒ¼ãƒ ã¨ææ”œã—ã¦ãŠã‚Šã€ã‚¢ã‚¯ã‚»ãƒ©ãƒ¬ãƒ¼ãƒ†ãƒƒãƒ‰ データ サイエンスを誰もãŒä½¿ç”¨ã§ãるよã†ã«ã—ã¾ã™ã€‚
エンタープライズ データ サイエンス
伿¥ã‚’ AI ã®æœ€å…ˆç«¯ã«å°ŽããŸã‚ã«æœ€é©åŒ–ã•れãŸã‚¨ãƒ³ãƒ‰ãƒ„ーエンドã®ã‚»ã‚ュアãªã‚¯ãƒ©ã‚¦ãƒ‰ãƒã‚¤ãƒ†ã‚£ãƒ– AI ソフトウェア プラットフォームã§ã‚ã‚‹NVIDIA AI Enterprise ã«ã‚ˆã‚Šã€ãƒ‡ãƒ¼ã‚¿ サイエンスãŒé«˜é€ŸåŒ–ã•れã¾ã™ã€‚NVIDIA AI Enterprise ã§RAPIDS ãªã©ã® NVIDIA AI オープンソース ソフトウェアã§ã®æ¤œè¨¼ãŠã‚ˆã³çµ±åˆãŒåˆ©ç”¨ã§ãã€AI ソリューション ワークフãƒãƒ¼ã¸ã‚¢ã‚¯ã‚»ã‚¹ã™ã‚‹ã“ã¨ã§æœ¬ç•ªã¾ã§ã®æ™‚é–“ãŒçŸç¸®ã•れã€ã‚ã‚‰ã‚†ã‚‹å ´æ‰€ã« AI ã‚’å°Žå…¥ã™ã‚‹ãŸã‚ã®èªå®šãŒæä¾›ã•れã¾ã™ã€‚ã¾ãŸã€ã‚¨ãƒ³ã‚¿ãƒ¼ãƒ—ライズ グレードã®ã‚µãƒãƒ¼ãƒˆã€ã‚»ã‚ュリティã€ç®¡ç†æ€§ã€API ã®å®‰å®šæ€§ã«ã‚ˆã‚Šã€ã‚ªãƒ¼ãƒ—ンソース ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã®æ½›åœ¨çš„ãªãƒªã‚¹ã‚¯ãŒè»½æ¸›ã•れã¾ã™ã€‚
AI Enterprise ã®è©³ç´°ã¯ã“ã¡ã‚‰
エンタープライズã¸ã®å°Žå…¥
ãŠå®¢æ§˜ã¯ã€RAPIDS ã®æ©Ÿèƒ½ãŒå®Œå…¨ã«æƒã£ãŸã‚¹ã‚¿ãƒƒã‚¯ã‚’使用ã—ã¦ã€è‡ªç¤¾ã®ãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã‚’拡大ã—ã¦ã„ã¾ã™ã€‚

CapitalOne ã¯è²¡å‹™åˆ†æžã¨ä¿¡ç”¨åˆ†æžã®ãƒ‘イプラインを高速化ã—ã€ãƒ¢ãƒ‡ãƒ« トレーニングを 100 å€å‘上ã•ã›ã¾ã—ãŸã€‚
オンデマンド セッションを視è´ã™ã‚‹
Uber 㯠GPU スケジューリングを備ãˆãŸ Spark 3.x をサãƒãƒ¼ãƒˆã™ã‚‹ Horovod を開発ã—ã¾ã—ãŸã€‚
オンデマンド セッションを視è´ã™ã‚‹Walmart ã¯ã€è£½å“代替アルゴリズムã§ã‚¹ã‚±ãƒ¼ãƒ©ãƒ“リティã®å•題を解決ã—ã¾ã—ãŸã€‚
オンデマンド セッションを視è´ã™ã‚‹
LinkedIn ã¯ã€RAPIDS cuDF ã§ã•らã«é«˜é€Ÿãªãƒ‡ãƒ¼ã‚¿åˆ†æžã‚’å¯èƒ½ã«ã™ã‚‹ DARWIN を開発ã—ã¾ã—ãŸã€‚
オンデマンド セッションを視è´ã™ã‚‹AT&T ã¯ã€ãƒ‡ãƒ¼ã‚¿ã‹ã‚‰ AI ã¸ã®ãƒ‘イプライン㮠GPU クラスター㫠RAPIDS Accelerator for Apache Spark ã‚’é©ç”¨ã—ã¾ã—ãŸã€‚
ブãƒã‚°ã‚’èªã‚€NASA ã¯ã€RAPIDS を使用ã—ã¦å¤§æ°—汚染ã®ç•°å¸¸ã‚’検出ãŠã‚ˆã³å®šé‡åŒ–ã—ã€ãƒã‚¤ã‚¢ã‚¹è£œæ£ãƒ¢ãƒ‡ãƒ«ã‚’構築ã—ã¾ã—ãŸã€‚
ブãƒã‚°ã‚’èªã‚€: パート 1 ブãƒã‚°ã‚’èªã‚€: パート 2TCS Optumera ã¯ã€RAPIDS Accelerator for Apache Spark ã«ã‚ˆã£ã¦éœ€è¦äºˆæ¸¬ãƒ‘イプラインを高速化ã—ã¾ã—ãŸã€‚
オンデマンド セッションを視è´ã™ã‚‹IRS ãƒãƒ¼ãƒ ã¯ã€Cloudera Data Platform 上㮠RAPIDS Accelerator for Apache Spark を使用ã—ã¦ä¸æ£è¡Œç‚ºã‚’発見ã—ã¾ã—ãŸã€‚
ブãƒã‚°ã‚’èªã‚€ä»–ã«ã‚‚ã€é–‹ç™ºè€…ã‚ットã€NVIDIA LaunchPadã€å±•開オプションã®ã‚¬ã‚¤ãƒ€ãƒ³ã‚¹ãªã©ã€RAPIDS ã«é–¢ã™ã‚‹ãƒªã‚½ãƒ¼ã‚¹ã‚’ã”用æ„ã—ã¦ã„ã¾ã™ã€‚