Kazuki Fujii

Kazuki Fujii 于 2024 年畢業于東京工業大學 (Tokyo Institute of Technology),獲得計算機科學學士學位,目前在東京工業大學 (2024 - 2026) 攻讀碩士學位。Kazuki 負責 Swallow 模型系列的預訓練和微調,Swallow 模型系列是截至 2023 年 12 月專門使用日語和英語的先進多語種大語言模型 (LLM).Kazuki 專注于分布式訓練和構建可擴展的訓練系統,以提高模型的性能和基礎設施效率。

Posts by Kazuki Fujii

生成式人工智能/大語言模型

使用 NVIDIA Megatron-LM 構建強大日語能力的 1720 億語言模型

生成式 AI 具有創建全新內容的能力,這是傳統機器學習(ML)方法難以實現的。在自然語言處理(NLP)領域, 大型語言模型(LLMs)… 2 MIN READ