Posts by Uttara Kumar
數據中心/云端
2025年 3月 20日
借助 NVIDIA TensorRT-LLM 提升 Microsoft Azure AI Foundry 的 Llama 模型性能
微軟與 NVIDIA 合作,宣布在其 Azure AI Foundry 平臺上實現 Meta Llama 系列模型的變革性性能提升。
1 MIN READ
數據中心/云端
2024年 8月 21日
Google Cloud Run 現已支持 NVIDIA L4 GPU、NVIDIA NIM 及大規模無服務器 AI 推理部署
部署 AI 賦能的應用和服務給企業帶來了重大的挑戰: 應對這些挑戰需要一種全棧方法,該方法可以優化性能、有效管理可擴展性并駕部署的復雜性,
2 MIN READ
網絡安全
2023年 5月 31日
使用機密計算保護敏感數據和人工智能模型
快速的數字化轉型導致整個企業生成的敏感數據激增。這些數據必須在本地、云中的數據中心中存儲和處理,或者在邊緣生成敏感和個人身份信息( PII…
3 MIN READ
對話式人工智能
2022年 7月 28日
在 Amazon EC2 上使用 NVIDIA Riva 構建語音支持的人工智能虛擬助手
語音 AI 可以在聯絡中心協助人類代理,為虛擬助理和數字化身供電,在視頻會議中生成實時字幕,等等。在后臺,
4 MIN READ
數據中心/云端/邊緣
2022年 3月 7日
使用 Bottlerocket 和 基于 NVIDIA 的 Amazon EC2 實例大規模部署 AI 工作負載
在大規模生產中部署人工智能支持的服務,如基于語音的助手、電子商務產品推薦和呼叫中心自動化,是一項挑戰。
1 MIN READ
圖形/仿真
2021年 11月 29日
AWS 推出首款基于 NVIDIA GPU 加速引力子的 Amazon EC2 G5g 實例
今天,在 AWS re : Invent2021 大會上, AWS 宣布 推出了 Amazon EC2 G5g 實例,
1 MIN READ