Sharath Sreenivas

Sharath Sreenivas 是 NVIDIA 的高級深度學習工程師，對學習算法的開發和優化感興趣。他擁有加州大學圣克魯茲分校計算機科學碩士學位，專注于機器學習。

Posts by Sharath Sreenivas

生成式人工智能/大語言模型 2024年 12月 17日

知識蒸餾是一種將更大的教師模型的知識轉移到更小的學生模型的方法，理想情況下可生成緊湊、易于部署的學生，且準確度與教師相當。 2 MIN READ

數據中心/云端 2024年 10月 8日

本文最初發布于 2024 年 8 月 21 日，但已根據當前數據進行了修訂。最近，NVIDIA 和 Mistral AI 推出了… 3 MIN READ

數據中心/云端 2024年 8月 21日

上個月，NVIDIA 和 Mistral AI 推出了 Mistral NeMo 12B，這是一款領先的先進的大型語言模型（LLM）。 1 MIN READ

數據中心/云端 2024年 8月 14日

由于大型語言模型（LLM）的有效性和通用性，它們現在已經成為自然語言處理和理解領域的主導力量。LLM（例如 Llama 3.1… 4 MIN READ