Kazuki Fujii

Kazuki Fujii 于 2024 年畢業于東京工業大學 (Tokyo Institute of Technology)，獲得計算機科學學士學位，目前在東京工業大學 (2024 - 2026) 攻讀碩士學位。Kazuki 負責 Swallow 模型系列的預訓練和微調，Swallow 模型系列是截至 2023 年 12 月專門使用日語和英語的先進多語種大語言模型 (LLM).Kazuki 專注于分布式訓練和構建可擴展的訓練系統，以提高模型的性能和基礎設施效率。

Posts by Kazuki Fujii

生成式人工智能/大語言模型 2024年 11月 11日

使用 NVIDIA Megatron-LM 構建強大日語能力的 1720 億語言模型

生成式 AI 具有創建全新內容的能力，這是傳統機器學習（ML）方法難以實現的。在自然語言處理（NLP）領域，大型語言模型（LLMs）… 2 MIN READ