NVIDIA Triton Inference Server
NVIDIA Triton? Inference Server? ?? ?? ? ??? ???? ? ??? ????, ???? ??? ??? ?? ??? AI? ???? ?? ?? ?? ?? ????????.
????NVIDIA Triton? ?? ???????
NVIDIA AI ???? ?? ??? Triton Inference Server? ?? GPU ?? CPU ?? ???? ??????? ??? AI ??? ??, ?? ? ??? ? ??? ?????? AI ??? ????? ??????. AI ???? ??? ???? Triton? ?? ???? ??? ??? ??? ?? ????? ??? ?????? ???? ??? ? ???, ???? ????, ?????, ?? ? ???? ???? ???? ??? ??? ??? ? ????.
?? ????
??? ????? ??
Triton? TensorFlow, NVIDIA? TensorRT?, PyTorch, MXNet, Python, ONNX, XGBoost, scikit-learn, RandomForest, OpenVINO, ??? C++ ? ?? ?? ? ?? ?????? ?? ?????.
??? ??
Triton? NVIDIA GPU, x86, Arm? CPU ? AWS Inferentia ?? ??? ?? ????, ???? ??(batching), ?? ??, ??? ?? ??, ?? ??? ? ???? ???/??? ??? ??? ???? ???? ??????.
DevOps? MLOps? ?? ??
Triton? ???????? ??? ?? Kubernetes? ????, ????? ?? Prometheus ???? ????, ??? ?? ????? ????, ?? ?? ??? ???? AI? Kubernetes ???? ?????. ?? ???? MLOps ????? ????? ?????.
NVIDIA AI? ?? ??
Triton? ??? NVIDIA AI ???? AI? ????? ???? ? ??? ??? ??? ? ? ????? ?????? ?? ??? ?? ??????? ?? ??? ?? ??? ????? ??? ?? ????? ?????.
?? ???????? ??? ?? ??? AI? ??????
??? ?? ??
Triton? ? ??????? ?? ??, ?? ?? ?? ??????? ?? ?? ?? ??? ?? GPU ?? CPU?? ??? ?????. ?? GPU ??? ??, Triton? ? GPU?? ? ??? ?? ????? ???? ???? ???? ????.
?? ???? ??? ?? ?? ??? ??? ??? ???? ??? ?? ??? ?????, ??(batch) ??? ??? GPU ? CPU ???? ?????, ??? ? ??? ???? ??? ????? ?????. Triton? ??? AI? ?? ?? ? ?? ??? ???? ?? ?? ??? ?????? ??? ?? ???? ?? ???? ?????.
Triton?? ??????? ?? ???? ??? ???? ???? ????? ??? ????? ? ????. Triton? ?? GPU? ???? ???? ?? ?? ???? ?? GPU/?? ?? ??? ?????.
??? ?? ??
Docker ???? ??? ???? Triton? Kubernetes? ???? ???????? ??? ? ?? ????? ?????. ?? Kubeflow ? KServe? ???? ???? AI ?????? ???? Prometheus ???? ???? GPU ???, ?? ??, ??? ??? ? ?? ???? ???????. ?? ??? ?? ?? ??????? ??? ? ??? ?? HTTP/gRPC ?????? ????, ??? ??? ??? ??? ???? ?? ????? ???? ?? ??? ??? ? ????.
Triton? ?? ?? API? ?? ?? ? ?? ?? ?? ??? ??? ? ????. GPU ?? CPU ???? ?? ?? ??? ??? ?? ??? ??? ??/???? ? ????. Triton??? GPU? CPU? ?? ??? ??? ????? ???? ??? ??? ???? ??? ?????, CPU ?? GPU?? ?? ??? ?? ?? ??? ??? ? ????.
Triton ?? ??? ????
?? ???? ?? ?? ???????
Triton? ??? ?? ??????? ??? ???? ?? ?? ??? ???? ?????. ???? ??? ??? ???? ? ??? ?? ? ??? ???? ???? ?? ?? ??? ??????. ?? ?? GPU ??? ??? ??? ?? ???? GPU ???? ????? ????, ?? ?? ??????? ?? ??? ????? ??? ?? ??? ?????. ?? ??????? ??? ??? ?? ???(EA)? ?? ?????.
EA ???? ????

??? ?? ?? ??
????? ??(?: GPT-3 - 175B, Megatron 530B ??)? ???? ??? ??? ???? ??? ????. GPU? ??? ?? ??? ??? ??? ?????, ??? ??? ?? ?? ?? GPU ??? ????? ?????. Triton? ??? ?? ?? ?? ?? ???? ?? ???, ?? ?? ??? ?? ??? GPU?? ? ??? ??? ? ????. ??? ?? GPU/?? ?? ??? ???? Triton? FasterTransformer ???? ??? GPT ???? T5, OPT ? UL2 ??? ???? ?? ??? ??? ?????.
????? ??? ?????? ???? ??? ??? ?? ??
Triton? Model Analyzer? ?? ?????? ?? ??, ???, ?? ?? ???? ?? Triton ?? ??? ???? ???? ????. ?? ??, ???, ??? ?? ?? ?? ?????? Quality-of-Service(QoS) ?? ??? ???? ??? ??? ???? ? ????, ??? ??? ?? ? ???? ??? ? ??? ? ???? ?????.
??? ????

Forest Inference Library(FIL) ???? ?? ?? ?? ?? ??
Triton? ??? FIL ???? CPU? GPU?? ?? ???(SHAP ?)? ?? ?? ?? ??? ??? ??? ?????. XGBoost, LightGBM, scikit-learn RandomForest, RAPIDS? cuML RandomForest ? ?? Treelite ??? ??? ?????.
??? ????????? ?? ?? ????
AI? ??? ??? ???? ?? ??? ??? ???? ???, ??? ??? ???? NVIDIA AI? ????. ?? ?? ????? ???? Triton? AI ?? ? ?? ??? ?? ??? ?????. Triton? Alibaba Cloud, Amazon Elastic Kubernetes Service (EKS), Amazon Elastic Container Service (ECS), Amazon SageMaker, Google Kubernetes Engine (GKE), Google Vertex AI, HPE Ezmeral, Microsoft Azure Kubernetes Service (AKS) , and Azure Machine Learning . ?? ?????. ???? Triton? ???? ??? ?????.
NVIDIA LaunchPad? ?? ???? ???? ?? ????? ??? ?? ?? ?? Triton Inference Server? ??????.
?? ?? ??
? ?? ??? ????
????? ?? NVIDIA ????
NVIDIA Inception? ????? NVIDIA Triton, NVIDIA ???, ?? ???, ?? ??? ?? ?? ??? ??? ????? ??? ????? ?? ?? ??? ?? ???????.
??? ????

??????? AI ?? ????
???? ???? AI? ?? ?? ????? ??? ? ?? ?? ???? ?? ?????. NVIDIA Triton? ?? ??? NVIDIA ?????? ?? ???? ?? ?? ??, ?? ?? ??, ?? ????, NVIDIA AI ??? ?? ?? ??? NVIDIA AI Enterprise? ?? ?????.
NVIDIA H100? ???? ??? NVIDIA AI Enterprise ?????? ????? ??? ?????.