Saurav Muralidharan

Saurav Muralidharan 是 NVIDIA Research 的高級研究科學家，曾供職于深度學習效率研究 (DLER) 團隊。Saurav 的工作重點是使用模型壓縮 (稀疏、低排名分解、提煉等) 和神經架構搜索 (NAS) 等技術，提高深度神經網絡 (尤其是大型語言模型 (LLM)) 的運行時性能和效率。

Posts by Saurav Muralidharan

數據中心/云端 2024年 10月 8日

Mistral-NeMo-Minitron 8B 模型提供超高精度

本文最初發布于 2024 年 8 月 21 日，但已根據當前數據進行了修訂。最近，NVIDIA 和 Mistral AI 推出了… 3 MIN READ

數據中心/云端 2024年 8月 21日

Mistral-NeMo-Minitron 8B 基礎模型實現準確性巔峰

上個月，NVIDIA 和 Mistral AI 推出了 Mistral NeMo 12B，這是一款領先的先進的大型語言模型（LLM）。 1 MIN READ

數據中心/云端 2024年 8月 14日

如何在 NVIDIA Llama-3.1-Minitron 4B 模型上修剪和提煉 Llama-3.1 8B

由于大型語言模型（LLM）的有效性和通用性，它們現在已經成為自然語言處理和理解領域的主導力量。LLM（例如 Llama 3.1… 4 MIN READ