Posts by Chris Alexiuk
Data Center / Cloud / Edge
2024 年 11 月 21 日
NVIDIA NIM でファインチューニングされた AI モデルのデプロイ
パフォーマンスを最適化した TensorRT-LLM 推論エンジンをローカルでビルドして、SFT でカスタマイズされたモデルに対する NIM マイクロサービスを迅速にデプロイする方法を説明します。
2 MIN READ
Generative AI
2024 年 10 月 28 日
LLM のモデル マージのご紹介
複數のカスタマイズされた LLM の重みを組み合わせることで、リソースの利用率を高めるモデル マージの、機能方法、種類、およびモデル マージがどのように繰り返され、進化しているのかについてご紹介します。
2 MIN READ