Ying Lin

Ying Lin 是 NVIDIA 的研究科學家,主要致力于提高預訓練數據質量和生成合成數據。加入 NVIDIA 之前,他曾在 Apple 從事自然語言理解工作。他擁有伊利諾伊大學香檳分校的博士學位。

Posts by Ying Lin

對話式人工智能

宣布推出 Nemotron-CC:用于 LLM 預訓練的萬億級英語語言數據集

NVIDIA 很高興地宣布發布 Nemotron-CC,這是一種包含 6.3 萬億個令牌的 英語語言 Common Crawl 數據集 , 1 MIN READ