Marcin Chochowski

Marcin Chochowski 是 NVIDIA 的高級深度學習工程師,專注于理解和優化處理語言和語音的深度神經網絡。他擁有波蘭華沙工業大學 (Warsaw University of Technology) 計算機科學碩士學位和生物識別安全博士學位。

Posts by Marcin Chochowski

數據中心/云端

Mistral-NeMo-Minitron 8B 模型提供超高精度

本文最初發布于 2024 年 8 月 21 日,但已根據當前數據進行了修訂。 最近,NVIDIA 和 Mistral AI 推出了… 3 MIN READ
數據中心/云端

Mistral-NeMo-Minitron 8B 基礎模型實現準確性巔峰

上個月,NVIDIA 和 Mistral AI 推出了 Mistral NeMo 12B,這是一款領先的先進的大型語言模型(LLM)。 1 MIN READ
數據中心/云端

如何在 NVIDIA Llama-3.1-Minitron 4B 模型上修剪和提煉 Llama-3.1 8B

由于大型語言模型(LLM)的有效性和通用性,它們現在已經成為自然語言處理和理解領域的主導力量。LLM(例如 Llama 3.1… 4 MIN READ