Sadaf Khan

Sadaf Khan 是 Data Factory 的一名數據科學家,從事對齊數據的質量保證、大語言模型的自動偏差評估以及人類內容安全紅色團隊工作。

Posts by Sadaf Khan

網絡安全

定義 LLM 紅色團隊

在一項活動中,人們為生成式 AI 技術 (例如大語言模型 (LLMs)) 提供輸入,以確定輸出是否會偏離可接受的標準。 1 MIN READ