NVIDIA NeMo
O NVIDIA NeMo é um kit de ferramentas de código aberto para o desenvolvimento de modelos de AI conversacional de última gera??o.
O desenvolvimento de modelos de AI conversacional de última gera??o exige que os pesquisadores experimentem rapidamente novas arquiteturas de rede. Isso significa passar pelo processo complexo e demorado de modificar várias redes e verificar a compatibilidade entre entradas, saídas e camadas de pré-processamento de dados.
O NVIDIA NeMo é um kit de ferramentas Python para desenvolver, treinar e ajustar modelos de AI conversacional acelerados por GPU usando uma interface simples. Com o NeMo, pesquisadores e desenvolvedores podem criar modelos de AI conversacional de última gera??o usando interfaces de programa??o de aplica??es (APIs) fáceis de usar. O NeMo executa computa??o de precis?o mista usando Tensor Cores em GPUs NVIDIA e pode ser facilmente expandido para várias GPUs para oferecer o melhor desempenho de treinamento possível.
O NeMo é usado para criar modelos para aplica??es de reconhecimento de fala automatizada (ASR - Automated Speech Recognition) em tempo real, processamento de linguagem natural (NLP - Natural Language Processing) e convers?o de texto em fala (TTS - Text-to-Speech), como transcri??es de chamadas de vídeo, assistentes de vídeo inteligentes e suporte automatizado para call centers nas áreas da saúde, finan?as, varejo e telecomunica??es.
Desenvolvimento Rápido de Modelos
Configure, desenvolva e treine modelos rapidamente com APIs Python simples.
Modelos personalizáveis
Fa?a o download e personalize modelos pré-treinados de última gera??o do NGC.
Amplamente Integrado
Interoperável com o ecossistema PyTorch e PyTorch Lightning.
Fácil Implanta??o
Aplique otimiza??es do NVIDIA? TensorRT? para inferência e exporte para o NVIDIA Riva com um único comando.
Integra??es Populares de Frameworks

PyTorch
NeMo foi desenvolvido com base no framework popular PyTorch e facilita os pesquisadores a usar os módulos NeMo com as aplica??es PyTorch

PyTorch Lightning
NeMo com Pytorch Lightning permite um treinamento de precis?o mista multi-GPU / multi-nó fácil e de alto desempenho

Hydra
Hydra é uma solu??o flexível que permite aos pesquisadores configurar módulos e modelos NeMo rapidamente a partir de um arquivo de configura??o e linha de comando.

DataSaur
A integra??o do DataSaur com o kit de ferramentas NeMo transforma facilmente os dados brutos em um modelo de AI de conversa??o totalmente desenvolvido.
"Ping An atende a milh?es de consultas de clientes todos os dias usando agentes de chat-bot. Como um dos primeiros parceiros do programa de acesso antecipado Riva, fomos capazes de usar as ferramentas e construir solu??es melhores com maior precis?o e menor latência, fornecendo assim melhores servi?os. Mais especificamente, com o NeMo, o modelo pré-treinado, e o pipeline ASR otimizado com Riva, o sistema obteve 5% de melhoria na precis?o, de forma a atender nossos clientes com melhor experiência."
— Dr. Jing Xiao, Cientista-Chefe da Ping An
"Em nossa avalia??o do Riva para assistentes virtuais e análise de fala, vimos uma precis?o notável ao ajustar os modelos de Reconhecimento Automatizado de Fala no idioma russo usando o kit de ferramentas NeMo em Riva. Riva pode fornecer até 10 vezes de desempenho de rendimento com otimiza??es potentes do TensorRT em modelos, ent?o estamos ansiosos para usar Riva para obter o máximo desses avan?os tecnológicos.”
— Nikita Semenov, Chefe de ML no MTS AI
“A InstaDeep oferece produtos e solu??es de AI de tomada de decis?o para empresas. Para este projeto, nosso objetivo é construir um assistente virtual na língua árabe, e NVIDIA Riva desempenhou um papel significativo na melhoria do desempenho da aplica??o. Usando o kit de ferramentas NeMo no Riva, pudemos ajustar um modelo de fala para texto em árabe para obter uma taxa de erro de palavras t?o baixa quanto 7,84% e reduzimos o tempo de treinamento do modelo de dias para horas usando as GPUs. Esperamos integrar esses modelos no pipeline de ponta a ponta do Riva para garantir latência em tempo real.”
— Karim Beguir, CEO e Cofundador da InstaDeep
“Por meio do programa de acesso antecipado do NVIDIA Riva, pudemos potencializar nossos produtos de AI de conversa??o com modelos de última gera??o usando NVIDIA NeMo, reduzindo significativamente o custo inicial. O reconhecimento de voz do Riva tem latência incrivelmente baixa e alta precis?o. Ter a flexibilidade para implantar no local e oferecer uma variedade de op??es de privacidade e seguran?a de dados para nossos clientes nos ajudou a posicionar nossos produtos habilitados para AI de conversa??o em novos setores da indústria.”
— Rajesh Jha, CEO da Siminsights.
"Na MeetKai, criamos assistentes virtuais que facilitam a vida das pessoas. Quando come?amos nossa empresa, enfrentamos desafios de engenharia e produ??o porque n?o havia muitos kits de ferramentas de AI de conversa??o de código aberto e de alta qualidade. O NVIDIA NeMo ajudou nossos esfor?os de engenharia ao fornecendo APIs fáceis de usar e reduzindo nossos custos em 25%. Esperamos continuar a trabalhar com o NeMo para criar o auxiliar de IA definitivo.”
— James Kalpan, CEO da MeetKai
“Kensho alavanca os dados e pesquisas de classe mundial da S&P Global para construir ferramentas incríveis que ajudam as pessoas a tomar decis?es baseadas em fatos. Usando NVIDIA NeMo em GPUs, Kensho transcreveu com sucesso dezenas de milhares de chamadas de ganhos, apresenta??es de gerenciamento e chamadas de aquisi??o, desbloqueando melhorias de precis?o de dois dígitos e permitindo que a S&P Global aumentasse a cobertura de chamadas de lucros em mais de 25%.”
— Keenan Freyberg, Gerente de Produto na Kensho
“Nosso objetivo com o SpeechBrain no MILA é construir um kit de ferramentas completo que pode acelerar significativamente a pesquisa e o desenvolvimento de modelos de fala. Estamos interessados em expandir ainda mais os limites das tecnologias de fala integrando-nos aos módulos NeMo, principalmente reconhecimento de fala e modelagem de linguagem.”
— Mirco Ravanelli, Cientista da Fala e Deep Learning na MILA
Componha Facilmente Novas Arquiteturas de Modelos
O NeMo inclui cole??es específicas de domínio de ASR, NLP e TTS para desenvolver modelos de última gera??o, como QuartzNet, Jasper, BERT, Tacotron2 e WaveGlow, em três linhas de código. O modelo NeMo é composto por Módulos Neurais, que s?o os blocos de constru??o dos modelos. As entradas e saídas desses módulos s?o fortemente tipadas com tipos neurais que podem executar automaticamente as verifica??es semanticas entre os módulos.
O NeMo foi projetado para oferecer alta flexibilidade, e você pode usar o framework Hydra para modificar o comportamento dos modelos com facilidade. Por exemplo, é possível modificar a arquitetura do módulo Jasper Encoder no diagrama a seguir usando o Hydra.
Retreine Modelos de AI Conversacional de última Gera??o

Vários modelos NeMo pré-treinados de última gera??o est?o disponíveis no NGC, treinados por mais de 100 mil horas no NVIDIA DGX? em conjuntos de dados abertos e proprietários. Você pode ajustar esses modelos ou modificá-los com o NeMo antes de treiná-los para seu caso de uso.
O NeMo usa precis?o mista nos Tensor Cores para acelerar o treinamento em até 4,5 vezes em uma única GPU em compara??o com a precis?o do FP32. Você pode dimensionar ainda mais o treinamento para sistemas com várias GPUs e clusters com vários nós.
Ecossistema Flexível, de Código Aberto e Rápida Expans?o
O NeMo foi desenvolvido com base em PyTorch e PyTorch Lightning, oferecendo um caminho fácil para os pesquisadores desenvolverem e integrarem com módulos com os quais já est?o familiarizados. O PyTorch e o PyTorch Lightning s?o bibliotecas Python de código aberto que fornecem módulos para compor modelos.
Para oferecer aos pesquisadores a flexibilidade para personalizar os modelos/módulos com facilidade, o NeMo foi integrado ao framework Hydra. O Hydra é um framework popular que simplifica o desenvolvimento de modelos de AI conversacional complexos.
O NeMo está disponível como código aberto para que os pesquisadores possam contribuir e desenvolvê-lo.

Implante em Servi?os em Tempo Real

Os modelos NeMo podem ser facilmente exportados para os servi?os do NVIDIA Riva para inferência de alto desempenho com um único comando. Você pode exportar modelos em ONNX, PyTorch e TorchScript.
O Riva aplica otimiza??es avan?adas do TensorRT e configura o servi?o para que você possa acessar esses modelos por meio de uma API padr?o.
Amplamente Adotado

Recursos
Introdu??o aos Tutoriais
Confira os tutoriais para come?ar a trabalhar rapidamente com modelos de fala e linguagem de última gera??o.
Fa?a um Tour pelo NeMo
Entenda as vantagens de usar NVIDIA NeMo em um passo a passo com o Notebook Jupyter.
Crie Aplica??es de AI de Conversa??o
Aprenda a construir e ajustar os servi?os ASR, NLP e TTS com NVIDIA NeMo e Riva.
Veja Mais Blogs de AI de Conversa??o
Mantenha-se atualizado aprendendo as novidades e novidades da AI de conversa??o.
O NeMo está disponível para download no NGC. Você também pode fazer o download com o comando de instala??o pip e o contêiner do Docker a partir do repositório GitHub do NeMo