Vijay Singh

Vijay Singh は、NVIDIA プラットフォームで高速化されたコンピューティング ワークロードの最適化に取り組んでいるシニア パフォーマンス エンジニアです。彼は、ネットワークを専門とするシステム ソフトウェアの経歴があります。カリフォルニア大學バークレー校でデータ サイエンスの修士號を取得。

Posts by Vijay Singh

Data Center / Cloud / Edge

NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化

NVIDIA GH200 Grace Hopper Superchip を活用し、システム スループットを犠牲にすることなく、x86 ベースの NVIDIA H100 サーバーと比較して、Llama 3 70B モデルでマルチターンでユーザーとのやり取りする場合、TTFT を最大 2 倍に向上させる方法について解説します。 2 MIN READ