NVIDIA NeMo

NVIDIA NeMo es un conjunto de herramientas de cÃ³digo abierto para desarrollar modelos de IA conversacional de Ãºltima generaciÃ³n.

Descargar Ahora

La construcciÃ³n de modelos de IA conversacional de Ãºltima generaciÃ³n requiere que los investigadores experimenten rÃ¡pidamente con arquitecturas de red novedosas. Esto significa pasar por el complejo y lento proceso de modificar mÃºltiples redes y verificar la compatibilidad entre las entradas, salidas y capas de preprocesamiento de datos.

NVIDIA NeMo es un kit de herramientas de Python para crear, entrenar y ajustar modelos de IA conversacional acelerados por GPU utilizando una interfaz simple. Con NeMo, los investigadores y desarrolladores pueden crear modelos de IA conversacionales de Ãºltima generaciÃ³n aprovechando interfaces de programaciÃ³n de aplicaciones (API) fÃ¡ciles de usar. NeMo ejecuta computaciÃ³n de precisiÃ³n mixta utilizando Tensor Cores en las GPUs de NVIDIA y puede escalar a mÃºltiples GPUs fÃ¡cilmente para brindar el mayor rendimiento de entrenamiento posible.

NeMo se utiliza para construir modelos para aplicaciones de reconocimiento de voz automatizado (ASR), procesamiento de idiomas naturales (NLP) y texto a voz (TTS) en tiempo real, como transcripciones de videollamadas, asistentes de video inteligentes y soporte de centro de llamadas automatizado en los sectores de la atenciÃ³n de la salud, finanzas, comercio minorista y telecomunicaciones.

Desarrollo RÃ¡pida de Modelos

Configura, crea y entrena modelos rÃ¡pidamente con APIs de Python simples.

Modelos personalizables

Descarga y personaliza modelos de Ãºltima generaciÃ³n previamente entrenados de NGC.

Ampliamente integrado

Interoperable con el ecosistema PyTorch y PyTorch Lightning.

FÃ¡cil ImplementaciÃ³n

Aplica optimizaciones de NVIDIA? TensorRT? para inferencia y exportaciÃ³n a NVIDIA Riva con un solo comando.

Integraciones de Frameworks Populares

PyTorch

NeMo estÃ¡ construido sobre el popular framework de PyTorch y facilita a los investigadores el uso de los mÃ³dulos de NeMo con aplicaciones de PyTorch.

MÃ¡s InformaciÃ³n

PyTorch Lightning

NeMo con Pytorch Lightning permite un entrenamiento fÃ¡cil y eficaz de precisiÃ³n mixta multi-GPU/multi-nodo

MÃ¡s InformaciÃ³n

Hydra

Hydra es una soluciÃ³n flexible que permite a los investigadores configurar mÃ³dulos y modelos de NeMo rÃ¡pidamente desde un archivo de configuraciÃ³n y una lÃnea de comando.

MÃ¡s InformaciÃ³n

DataSaur

La integraciÃ³n de DataSaur con el kit de herramientas de NeMo transforma fÃ¡cilmente los datos sin procesar en un modelo de IA conversacional completo.

MÃ¡s InformaciÃ³n

"Ping An aborda millones de consultas de los clientes cada dÃa mediante agentes de bots de chat. Como socios iniciales del programa de acceso temprano de Riva, pudimos usar las herramientas y crear mejores soluciones con mayor precisiÃ³n y menor latencia, proporcionando asÃ mejores serviciosx. MÃ¡s especÃficamente, con NeMo, el modelo pre-entrenado, y la canalizaciÃ³n ASR optimizada con Riva, el sistema logrÃ³ una mejora del 5% en la precisiÃ³n, a fin de brindar un mejor servicio a nuestros clientes."

â€” Dr. Jing Xiao, CientÃfico Jefe de Ping An

Componer FÃ¡cilmente Nuevas Arquitecturas de Modelos

NeMo incluye colecciones especÃficas de dominio para ASR, NLP y TTS para desarrollar modelos de vanguardia como QuartzNet, Jasper, BERT, Tacotron2, y WaveGlow en tres lÃneas de cÃ³digo. El modelo NeMo se compone de mÃ³dulos neuronales, que son los componentes bÃ¡sicos de los modelos. Las entradas y salidas de estos mÃ³dulos estÃ¡n fuertemente tipificadas con tipos neuronales que pueden realizar automÃ¡ticamente las verificaciones semÃ¡nticas entre los mÃ³dulos.

NeMo se dise?Ã³ para ofrecer una alta flexibilidad y puede usar el framework Hydra para modificar el comportamiento de los modelos fÃ¡cilmente. Por ejemplo, puedes modificar la arquitectura del mÃ³dulo Jasper Encoder en el siguiente diagrama usando Hydra.

Figura 1: Proceso ASR que usa mÃ³dulos NeMo

Volver a Entrenar Modelos de IA Conversacional de SOTA

Figura 2: Modelos previamente entrenados muy precisos

Varios modelos de Ãºltima generaciÃ³n previamente entrenados por NeMo estÃ¡n disponibles en NGC y estÃ¡n entrenados durante mÃ¡s de 100,000 horas en NVIDIA DGX? en conjuntos de datos abiertos y propietarios. Puede ajustar estos modelos o modificarlos con NeMo antes de entrenarlos para tu caso de uso.

NeMo utiliza precisiÃ³n mixta en Tensor Cores para acelerar el entrenamiento hasta 4.5 veces en una sola GPU en comparaciÃ³n con la precisiÃ³n FP32. Puede escalar aÃºn mÃ¡s el entrenamiento a sistemas de mÃºltiples GPU y clÃºsteres de mÃºltiples nodos.

Ecosistema Flexible, de CÃ³digo Abierto y en RÃ¡pida ExpansiÃ³n

NeMo se basa en PyTorch y PyTorch Lightning, a fin de proporcionar un camino fÃ¡cil para que los investigadores desarrollen e integren los mÃ³dulos con los que ya se sienten cÃ³modos. PyTorch y PyTorch Lightning son bibliotecas de Python de cÃ³digo abierto que proporcionan mÃ³dulos para componer modelos.

A fin de proporcionar flexibilidad al investigador para que personalice modelos y mÃ³dulos fÃ¡cilmente, NeMo se integrÃ³ con el framework Hydra. Hydra es un framework popular que simplifica el desarrollo de modelos complejos de IA conversacional.

NeMo estÃ¡ disponible como cÃ³digo abierto para que los investigadores puedan aprovecharlo para contribuir y desarrollar.

Figura 3: IntegraciÃ³n de NeMo con PyTorch y PyTorch Lightning

Implementar en Servicios en Tiempo Real

Figura 4: IntegraciÃ³n de NeMo a Riva

Los modelos NeMo se pueden exportar fÃ¡cilmente a los servicios NVIDIA Riva para obtener inferencias de alto rendimiento con un solo comando. Puede exportar modelos en ONNX, PyTorch y TorchScript.

Riva aplica potentes optimizaciones de TensorRT y configura el servicio para que puedas acceder a estos modelos a travÃ©s de una API estÃ¡ndar.

Ampliamente Adoptado

Recursos

Comience con los Tutoriales

Consulte los tutoriales para comenzar a trabajar rÃ¡pidamente con modelos de habla y lenguaje de Ãºltima generaciÃ³n.

MÃ¡s InformaciÃ³n

Haga un Recorrido por NeMo

Comprenda las ventajas de utilizar NVIDIA NeMo con un tutorial de Jupyter Notebook.

Leer Blog

Cree Aplicaciones de Inteligencia Artificial Conversacional

Aprenda a crear y ajustar los servicios ASR, NLP y TTS con NVIDIA NeMo y Riva.

Ver Webinar

Explore MÃ¡s Blogs de IA Conversacionales

Explorar Blogs

NeMo se puede descargar en NGC. TambiÃ©n puedes descargarlo con el comando pip install y el contenedor Docker desde el repositorio de NeMo GitHub

Descargar Ahora

äººäººè¶…ç¢°97caoporenå›½äº§