• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • AI Platforms / Deployment

    NVIDIA DGX Cloud, AI ??? ?? ????? ?? ?? ?? ??? ??? ??

    Reading Time: 4 minutes

    AI ???? ????? ??? ???? ???? ??? ?? ?? ??? ????? ??? ? ??? ??? ????? ???? ????. ???, ????, ?? ????? ? ?? ??? ????? ???? ?? ?????.

    AI ???? ??? ????? ??? ??? ? ????. ?? ????? ?? ???? ??? ?????? ??? ?????, ?? ????? ????? ??? ??? ?? ??? ?????.

    NVIDIA DGX Cloud Benchmarking Recipes? ? ?????? ??? ??? ?? ???? ????, ??? ??? ???? ?? ?? ??? ?????.

    ??? ??? NVIDIA DGX Cloud Benchmarking Recipes? ?????.

    AI ???? ??? ????? ????

    DGX Cloud Benchmarking Recipes? ?? ???? ??? ???? AI ?? ????? ??? ??? ??? ? ?? ???? ???? ?????. ? ???? ???? ?? AI ??? ???? ?? AI ??????? ??? ????? ???????.

    ?? ????? ??(FLOPS)?? ???? ?? ? ??? ?? ??? AI ???? ???? ??? ???? ? ??? ?? ? ????. ????? FLOPS? ??? ? ??? ??????, ?? ?? ?????? ??? ??? ??? ?? ?? ? ??? ????.

    ??? AI ??? ?? ??? ????, ?????, ???, ?? ??? ? ?? ?? ??? ??? ????.

    ?? ??, ???? NVIDIA NVLink ???? ???? ???? ?? ???(tensor parallelism)? ?? ?? ?? ?? ??? ?? ??? 8-GPU ??? ?? ??? ? ????. ?? NVIDIA Grace ?? ?????? NVLink ???? ??? ?? ?? ???????? ? ?? FLOPS? ??? ? ?? ???? ??? ?? ?? ?? ??? ?? ? ????.

    FLOPS??? AI ???? ???? ?? ??? ?? ??? ???? ???? ?????. ?? Llama 3.1 ??? ?? ?? AI ??????? ??? ??? ??? ???? ????? ???? ?? ? ????, ?? ?? ?? ?? ???? ???? ??? ????? ???? ??? ??? ? ????.

    ?? 1. ???? ?? AI ??? ?? ??

    ???? ?? AI ???? ??? ??? ??? ??

    ??? ??? ??? ??? ??? ??? ????:

    • ?? ????
    • ???? ??
    • ??? ??
    • ????? ??
    • ???? ????
    • ???? ?? ??

    AI ???? ??? ?? ??

    • ?? ?? ?? ??
    • ?? ???
    • ?? ??(batch size)
    • ?? ???(precision format)
    • ??? ?? ??

    ???? ?? ???? ????

    ????? ?? ??? ??, NVIDIA DGX Cloud Benchmarking Recipes? ?? ??? ????? ????? ?? ??? ??? ???. ? ???? Llama 3.1, Grok, Mixtral? ?? ?? ??? ?? ????? ??? ??? ???? ??? ???? ? ??? ???????.

    ???????????? ????????? ?? (#GPUs)DTYPE
    Nemotron4Training15B and 340B benchmarks24.09Synthetic2048FP8, BF16
    Nemo MegatronTraining175B benchmarks24.05Pile2048FP8, BF16
    Llama 3.1Training8B, 70B, and 405B benchmarks24.09Pile2304FP8, BF16
    PaXMLTraining5B and 175B benchmarks24.03.04Synthetic2048FP8, BF16
    MaxtextTrainingLlama2 70B benchmarks2024.12.09Synthetic2048FP8, BF16
    Grok1TrainingGrok1 314B benchmarks24.09Synthetic2048FP8, BF16
    Llama 2Fine TuningHugging Face 70B benchmarks24.02HF Llama2512BF16
    MistralFine TuningHugging Face 7B benchmarks24.02HF Mistral256BF16

    ? 1. DGX ???? ???? ??? ?????? ?? ??? ????

    ? 1?? ?????? ??(training)? ?? ??(fine-tuning)? ?? ????, ??? ?? FP8 ? BF16? ?????.

    ? ?? ????? ???? ???? ??? ????. ????? ??? ??? ? ????? ???? ? ?? ? ??? “?? ??? ?? ?? ???? ??? ??? ?????”???.

    ??? ?? ??? ? ??? ??? ??, ??? ? ??? ??? ????. ??? ??? ??? ?? ? ??? ??, ?? ??? ?? ??????? ??? ?? ?????. ?? GPU ?? ??? ? ???? ?? ??? ?? ? ???, ?? ??(weak scaling) ?? ?? ??(strong scaling) ??? ?? ?? ??? ??? ??? ? ????.

    ? ????? ???? ??? ?? ??? ???? ???? ??? ??? ??? ? ????.

    ?? ????? ??? ??, ?? ??, ?? ???(precision format), ??? ?? ?? ?? ???? ???. ??? ????? NVLink? ????? ??? ????? ???? ??(?: ?? ???, ???? ???), ???? ?? ??(scale-out fabric)? ?? ???? ?? ??(networking collectives)? ??? ???? ??? ???? ???(?: ????? ???, ??? ?? ???).

    ??? ?? ???? NVIDIA SpectrumX ? InfiniBand ???? ?????? ? ? ??? ?? ?? ?? ??(RDMA)? ???? ?? ??(congestion management) ? ??? ???(adaptive routing)? ???? ???? ?????. AI ????? ???? ??? ???? ??(jitter)? ??? ???? ??? ??? ???? ???? ??? ??? ???? ?? ??????.

    FP8 ????

    DGX Cloud Benchmarking Recipes? FP8 ????? ???? ?? ? ?? ?? ??? ????, ? ??? ???? ??? ??? ??? ? ??? ????. ?? ??, Llama 3.1 70B ??? ?? ????? DGX Cloud ????? ??? ????? ???? FP8 ??? ???? ????.

    AI ?????? ?? ???? ???? ???? ?? ??? ?????. DGX Cloud Benchmarking Recipes? ??? ?? ??? ?? ?? ?? ??? ????, ?? ?? ? ??? ? ?? ???? ???? ??? ??? ? ??? ???.

    ??? ?? ?? ????? ?? FLOPS ???(MFU)? ?? ??? ?????. MFU? ??? ?? ?? ??? ??? ????? ?????? ???? ???, ?? ??? MFU? ???(throughput)? ??? ? ????. ??? ??? ????? ?????? ???? ??? ???? ???? ? ??? ??? ? ????.

    DeepSeek-R1? 671B ????? ?? ???, NVIDIA H200 GPU ???? ?????. ? ??? ?? ???? ?? ???, ?? ?? ??, ????, ??? ??? ????? ????? ??? ??? ??? ??? ??? ? ??? ?????. ???? ????? ?? ???? ??? ????, ?? ?? ???? ??? ???? ????? GPU ???? ??? ???? ? ????.

    ?????, ? ????? ?? ??? ??? ?????? ??? ?? ?? ??? ??? ???? ?????. ?? ??, ??? ??? ?? ?? ??? ????? ??? ??? ?? ??? ? ????.

    DGX Cloud Benchmarking Recipes ????

    ??? ??? ?????? ???? NVIDIA? ?? ?????(NGC Catalog)?? ?????. ?? ??? ???? ?? ??? ??? DGX Cloud Benchmarking 24.11.1? ?????.

    ? ???? ????? ??? ?? ??? ??? ? ????.

    • ?? ? ???? ?? ????? ????
    • ??? ?? ?? ???(synthetic data)? ???? ????
    • ?? ?? ?? ? ??(stdout) ?? ??
    • ???? ???? ??? ?? ??
    • NVIDIA ?? ????? ?? ???? ?? ??

    ? ???? Slurm ???? ?? ???? ??? ??, ?? Kubernetes ??? ?? ????. DGX Cloud Benchmarking Recipes? ????? ?? ????? ?? ???? ????? ?, ???? ?? ? ???? ????? ???? ???.

    ??? ?? ??? ????? ?????

    ???? AI ???? ??? ??? ????? ?? ?? ??? ??? ?? ???? ??? ?????? ???? ?? ?????. GPU? ?? ??? ?????, ??? ???? ???? ? ????? ???? ????? ?????? ??? ?? ??? ???? ???? ?? ????.

    NVIDIA? ???? ???? ???? ?? ??? ?? ??? ????? ???? ????. ?? ??, NVIDIA NVLink ? NVLink Switch? ?? ???? ??????? NVIDIA TensorRT-LLM? ?? ????? ??????? ????? ??? ??? ?? ??? ?? ??? ??? ????.

    ?? ??, MLPerf Inference?? NVIDIA H100 GPU? ?? ??? ??? ? 1? ?? 3.4? ???????. ??? ???? ???? ??? ? ??? ??? ????, ??? ?? ??? ???, ???? ?? AI ??? ???? ? ??? ?????.

    ? ???? ???? ????:

    • FP8? ??? ??? ??? ?? AI ???? ???
    • ???? ??? NVIDIA?? ??? ??? ??? ???? ??
    • ?? ???? ???? ?? ?? ?? ??

    ?? ?? ??? ???? ???? ??? ??? ??? ?? ??? ??? ? ????. ??? ?? ?? ?????? ??? ??? ??? ??? ? ????. NVIDIA? ????? ???? ?? ??? ??? ????? ???? ????, AI ??? ??? ?????, ??? ????? ???? ?? ??? ??? ? ????.

    ??? ??? DGX Cloud Benchmarking Recipes?? ?????.

    ?? ???

    Discuss (0)
    0

    Tags

    人人超碰97caoporen国产