Maggie Zhang

Maggie Zhang 是 NVIDIA 的深度學習工程師,致力于深度學習框架和應用程序。她在澳大利亞新南威爾士大學獲得計算機科學和工程博士學位,在那里她從事 GPU / CPU 異構計算和編譯器優化。

Posts by Maggie Zhang

生成式人工智能/大語言模型

使用 NVIDIA NIM 構建基于 VLM 的簡單多模態信息檢索系統

在當今數據驅動的世界中,即使是從少量數據中檢索準確信息的能力,對于尋求精簡、有效的快速部署、原型設計或實驗解決方案的開發者來說也至關重要。 3 MIN READ
對話式人工智能

利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 實現 LLM 擴展

大語言模型 (LLMs) 已廣泛應用于聊天機器人、內容生成、摘要、分類、翻譯等領域。State-of-the-art LLMs 和基礎模型如… 5 MIN READ
對話式人工智能

使用 Kubernetes 自動縮放 NVIDIA Riva 部署,用于生產中的語音 AI

語音 AI 應用,從呼叫中心到虛擬助理,嚴重依賴 自動語音識別 ( ASR )和文本轉語音( TTS )。 4 MIN READ
數據中心/云端/邊緣

分割 NVIDIA A30 GPU 并征服多個工作負載

多實例 GPU ( MIG )是 NVIDIA H100 , A100 和 A30 張量核 GPU ,因為它可以將 GPU 劃分為多個實例。 4 MIN READ
計算機視覺/視頻分析

使用 NVIDIA A30 GPU 加速人工智能推理工作負載

NVIDIA A30 GPU 基于最新的 NVIDIA Ampere 體系結構,可加速各種工作負載,如大規模人工智能推理、 2 MIN READ
人工智能/深度學習

使用 MIG 和 Kubernetes 大規模部署 MIG Triton

NVIDIA Triton 推理服務器是一款開源人工智能模型服務軟件,可簡化在生產中大規模部署經過培訓的人工智能模型。 8 MIN READ