NVIDIA Riva

NVIDIA Riva Ã© um framework de softwares para servi?os de AI conversacional multimodal que oferece desempenho em tempo real em GPUs.

Webinar IntrodutÃ³rio??Inscreva-se no Programa Beta

Riva Ã© um framework de softwares totalmente acelerado para a cria??o de servi?os de AI conversacional multimodal que seguem um pipeline de deep learning de ponta a ponta. Os desenvolvedores podem ajustar facilmente modelos de Ãºltima gera??o de acordo com seus dados para entender melhor o seu contexto especÃfico, otimizando a inferÃªncia e oferecendo servi?os em tempo real de ponta a ponta que s?o executados em menos de 300ms, garantindo uma taxa de transferÃªncia 7 vezes maior com GPUs em compara??o a CPUs.

O framework Riva conta com modelos prÃ©-treinados de AI conversacional, ferramentas do Kit de Ferramentas de AI da NVIDIA e servi?os otimizados de ponta a ponta para tarefas de fala, vis?o e compreens?o de linguagem natural (NLU - Natural Language Understanding).

Com a uni?o simultanea de vis?o, Ã¡udio e outras informa??es de sensores, Ã© possÃvel ter recursos como conversas com vÃ¡rios usuÃ¡rios e vÃ¡rios contextos em softwares como assistentes virtuais, de compromissos para vÃ¡rios usuÃ¡rios e de centrais de atendimento.

Os softwares baseados no Riva foram otimizados para maximizar o desempenho na plataforma NVIDIA EGX? no cloud, no data center e no edge.

Desempenho em Tempo Real

Execute softwares de AI conversacional baseados em deep learning em menos de 300 ms, o limite de latÃªncia para o desempenho em tempo real.

Multimodal

Unifique fala e vis?o para oferecer intera??es precisas e naturais em assistentes virtuais, chatbots e outros softwares de AI conversacional.

Implementa??o Automatizada

Use um comando para implementar servi?os de AI conversacional no cloud ou no edge.

â€œA Ping An atende a milh?es de consultas de clientes todos os dias usando agentes de chat-bot. Como um dos primeiros parceiros do programa de acesso antecipado do Riva, fomos capazes de usar as ferramentas e construir solu??es melhores com maior precis?o e menor latÃªncia, fornecendo assim melhores servi?os. Mais especificamente, com o NeMo, o modelo prÃ©-treinado, e o pipeline ASR otimizado com Riva, o sistema obteve 5% de melhoria na precis?o, de forma a atender nossos clientes com melhor experiÃªncia.â€

â€” Dr. Jing Xiao, Cientista-Chefe da Ping An

Crie Modelos de Deep Learning de Ãºltima Gera??o

Figura 1: Modelos prÃ©-treinados

Use modelos de deep learning de Ãºltima gera??o com mais de 100 mil horas de treinamento em sistemas NVIDIA DGX? para tarefas de fala, compreens?o de linguagem e vis?o. Os modelos e scripts prÃ©-instalados usados no Riva est?o disponÃveis gratuitamente no NGC?.

VocÃª pode ajustar esses modelos para seu domÃnio com seus dados usando NVIDIA NeMo e o Kit de Ferramentas Transfer Learning para implantÃ¡-los facilmente como servi?os.

Desenvolva Novos Recursos Multimodais

Crie recursos multimodais, como transcri??o de vÃ¡rios locutores, chatbots, reconhecimento de gestos e ativa??o com o olhar para seus softwares de AI conversacional.

O Riva vem com exemplos de vÃ¡rios recursos que vocÃª pode personalizar conforme seu caso de uso. Com o Riva, vocÃª pode usar pipelines visuais, de fala e de compreens?o de linguagem, alÃ©m de um gerenciador de caixas de diÃ¡logo compatÃvel com vÃ¡rios usuÃ¡rios e contextos para criar outros recursos.

Figura 2: Software multimodal com vÃ¡rios usuÃ¡rios e contextos

Servi?os Otimizados para Tarefas EspecÃficas

Figura 3: Servi?os de AI do Riva

Acesse servi?os de alto desempenho para tarefas como reconhecimento de fala, reconhecimento de inten??o, convers?o de texto em fala, estimativa de pose, detec??o de olhar e detec??o de pontos faciais com uma API simples.

Ã© possÃvel unir os pipelines de cada recurso para criar outros recursos. Todos os pipelines s?o ajustados para oferecer o maior desempenho possÃvel e podem ser personalizados conforme seu caso de uso especÃfico.

Crie e Implemente Servi?os Facilmente

Automatize as etapas de modelos prÃ©-treinados a servi?os otimizados implementados no cloud, no data center e no edge. AlÃ©m disso, o Riva aplica otimiza??es avan?adas do NVIDIA? TensorRT? a modelos, configura o Servidor de InferÃªncia NVIDIA Triton?, e exp?e os modelos como um servi?o usando uma API padr?o.

Na implementa??o, vocÃª pode usar um Ãºnico comando para baixar, configurar e executar todo o software Riva ou servi?os individuais por meio de pacotes Helm em clusters do Kubernetes. Os pacotes Helm podem ser personalizados conforme seu caso de uso e sua configura??o.