Amr Elmeleegy

Amr Elmeleegy は、データ センターにおけるアクセラレーテッド コンピューティングのプリンシパル プロダクト マーケティング マネージャーで、NVIDIA AI 推論プラットフォームを中心に取り組んでいます。以前は AWS と SAP で事業開発と製品マーケティングを擔當していました。UC Berkeley Haas School of-Business でMBA を取得し、カイロ大學で電気工學の學士號を取得。

Posts by Amr Elmeleegy

Generative AI

NVIDIA TensorRT-LLM の KV Cache Early Reuseで、Time to First Token を 5 倍高速化

KV キャッシュの再利用技術と、TTFT のさらなる高速化を実現するベストプラクティスについて解説します。 2 MIN READ
Data Center / Cloud / Edge

NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化

NVIDIA GH200 Grace Hopper Superchip を活用し、システム スループットを犠牲にすることなく、x86 ベースの NVIDIA H100 サーバーと比較して、Llama 3 70B モデルでマルチターンでユーザーとのやり取りする場合、TTFT を最大 2 倍に向上させる方法について解説します。 2 MIN READ