NVIDIA NeMo
O NVIDIA NeMo é um kit de ferramentas de código aberto para o desenvolvimento de modelos de AI conversacional de última gera??o.
O desenvolvimento de modelos de AI conversacional de última gera??o exige que os pesquisadores experimentem rapidamente novas arquiteturas de rede. Isso significa passar pelo processo complexo e demorado de modificar várias redes e verificar a compatibilidade entre entradas, saÃdas e camadas de pré-processamento de dados.
O NVIDIA NeMo é um kit de ferramentas Python para desenvolver, treinar e ajustar modelos de AI conversacional acelerados por GPU usando uma interface simples. Com o NeMo, pesquisadores e desenvolvedores podem criar modelos de AI conversacional de última gera??o usando interfaces de programa??o de aplica??es (APIs) fáceis de usar. O NeMo executa computa??o de precis?o mista usando Tensor Cores em GPUs NVIDIA e pode ser facilmente expandido para várias GPUs para oferecer o melhor desempenho de treinamento possÃvel.
O NeMo é usado para criar modelos para aplica??es de reconhecimento de fala automatizada (ASR - Automated Speech Recognition) em tempo real, processamento de linguagem natural (NLP - Natural Language Processing) e convers?o de texto em fala (TTS - Text-to-Speech), como transcri??es de chamadas de vÃdeo, assistentes de vÃdeo inteligentes e suporte automatizado para call centers nas áreas da saúde, finan?as, varejo e telecomunica??es.
Desenvolvimento Rápido de Modelos
Configure, desenvolva e treine modelos rapidamente com APIs Python simples.
Modelos personalizáveis
Fa?a o download e personalize modelos pré-treinados de última gera??o do NGC.
Amplamente Integrado
Interoperável com o ecossistema PyTorch e PyTorch Lightning.
Fácil Implanta??o
Aplique otimiza??es do NVIDIA? TensorRT? para inferência e exporte para o NVIDIA Riva com um único comando.
Integra??es Populares de Frameworks

PyTorch
NeMo foi desenvolvido com base no framework popular PyTorch e facilita os pesquisadores a usar os módulos NeMo com as aplica??es PyTorch

PyTorch Lightning
NeMo com Pytorch Lightning permite um treinamento de precis?o mista multi-GPU / multi-nó fácil e de alto desempenho

Hydra
Hydra é uma solu??o flexÃvel que permite aos pesquisadores configurar módulos e modelos NeMo rapidamente a partir de um arquivo de configura??o e linha de comando.

DataSaur
A integra??o do DataSaur com o kit de ferramentas NeMo transforma facilmente os dados brutos em um modelo de AI de conversa??o totalmente desenvolvido.
"Ping An atende a milh?es de consultas de clientes todos os dias usando agentes de chat-bot. Como um dos primeiros parceiros do programa de acesso antecipado Riva, fomos capazes de usar as ferramentas e construir solu??es melhores com maior precis?o e menor latência, fornecendo assim melhores servi?os. Mais especificamente, com o NeMo, o modelo pré-treinado, e o pipeline ASR otimizado com Riva, o sistema obteve 5% de melhoria na precis?o, de forma a atender nossos clientes com melhor experiência."
— Dr. Jing Xiao, Cientista-Chefe da Ping An
![]()
Componha Facilmente Novas Arquiteturas de Modelos
O NeMo inclui cole??es especÃficas de domÃnio de ASR, NLP e TTS para desenvolver modelos de última gera??o, como QuartzNet, Jasper, BERT, Tacotron2 e WaveGlow, em três linhas de código. O modelo NeMo é composto por Módulos Neurais, que s?o os blocos de constru??o dos modelos. As entradas e saÃdas desses módulos s?o fortemente tipadas com tipos neurais que podem executar automaticamente as verifica??es semanticas entre os módulos.
O NeMo foi projetado para oferecer alta flexibilidade, e você pode usar o framework Hydra para modificar o comportamento dos modelos com facilidade. Por exemplo, é possÃvel modificar a arquitetura do módulo Jasper Encoder no diagrama a seguir usando o Hydra.
Retreine Modelos de AI Conversacional de última Gera??o

Vários modelos NeMo pré-treinados de última gera??o est?o disponÃveis no NGC, treinados por mais de 100 mil horas no NVIDIA DGX? em conjuntos de dados abertos e proprietários. Você pode ajustar esses modelos ou modificá-los com o NeMo antes de treiná-los para seu caso de uso.
O NeMo usa precis?o mista nos Tensor Cores para acelerar o treinamento em até 4,5 vezes em uma única GPU em compara??o com a precis?o do FP32. Você pode dimensionar ainda mais o treinamento para sistemas com várias GPUs e clusters com vários nós.
Ecossistema FlexÃvel, de Código Aberto e Rápida Expans?o
O NeMo foi desenvolvido com base em PyTorch e PyTorch Lightning, oferecendo um caminho fácil para os pesquisadores desenvolverem e integrarem com módulos com os quais já est?o familiarizados. O PyTorch e o PyTorch Lightning s?o bibliotecas Python de código aberto que fornecem módulos para compor modelos.
Para oferecer aos pesquisadores a flexibilidade para personalizar os modelos/módulos com facilidade, o NeMo foi integrado ao framework Hydra. O Hydra é um framework popular que simplifica o desenvolvimento de modelos de AI conversacional complexos.
O NeMo está disponÃvel como código aberto para que os pesquisadores possam contribuir e desenvolvê-lo.

Implante em Servi?os em Tempo Real

Os modelos NeMo podem ser facilmente exportados para os servi?os do NVIDIA Riva para inferência de alto desempenho com um único comando. Você pode exportar modelos em ONNX, PyTorch e TorchScript.
O Riva aplica otimiza??es avan?adas do TensorRT e configura o servi?o para que você possa acessar esses modelos por meio de uma API padr?o.
Amplamente Adotado

Recursos
Introdu??o aos Tutoriais
Confira os tutoriais para come?ar a trabalhar rapidamente com modelos de fala e linguagem de última gera??o.
Fa?a um Tour pelo NeMo
Entenda as vantagens de usar NVIDIA NeMo em um passo a passo com o Notebook Jupyter.
Crie Aplica??es de AI de Conversa??o
Aprenda a construir e ajustar os servi?os ASR, NLP e TTS com NVIDIA NeMo e Riva.
Veja Mais Blogs de AI de Conversa??o
Mantenha-se atualizado aprendendo as novidades e novidades da AI de conversa??o.
O NeMo está disponÃvel para download no NGC. Você também pode fazer o download com o comando de instala??o pip e o contêiner do Docker a partir do repositório GitHub do NeMo