Posts by Maggie Zhang
生成式人工智能/大語言模型
2025年 2月 26日
使用 NVIDIA NIM 構建基于 VLM 的簡單多模態信息檢索系統
在當今數據驅動的世界中,即使是從少量數據中檢索準確信息的能力,對于尋求精簡、有效的快速部署、原型設計或實驗解決方案的開發者來說也至關重要。
3 MIN READ
對話式人工智能
2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 實現 LLM 擴展
大語言模型 (LLMs) 已廣泛應用于聊天機器人、內容生成、摘要、分類、翻譯等領域。State-of-the-art LLMs 和基礎模型如…
5 MIN READ
對話式人工智能
2023年 1月 12日
使用 Kubernetes 自動縮放 NVIDIA Riva 部署,用于生產中的語音 AI
語音 AI 應用,從呼叫中心到虛擬助理,嚴重依賴 自動語音識別 ( ASR )和文本轉語音( TTS )。
4 MIN READ
數據中心/云端/邊緣
2022年 8月 30日
分割 NVIDIA A30 GPU 并征服多個工作負載
多實例 GPU ( MIG )是 NVIDIA H100 , A100 和 A30 張量核 GPU ,因為它可以將 GPU 劃分為多個實例。
4 MIN READ
計算機視覺/視頻分析
2022年 5月 11日
使用 NVIDIA A30 GPU 加速人工智能推理工作負載
NVIDIA A30 GPU 基于最新的 NVIDIA Ampere 體系結構,可加速各種工作負載,如大規模人工智能推理、
2 MIN READ
人工智能/深度學習
2021年 8月 25日
使用 MIG 和 Kubernetes 大規模部署 MIG Triton
NVIDIA Triton 推理服務器是一款開源人工智能模型服務軟件,可簡化在生產中大規模部署經過培訓的人工智能模型。
8 MIN READ