Nefi Alarcon – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Wed, 24 Aug 2022 04:31:44 +0000
zh-CN
hourly
1
196178272 -
OpenAI 展示 GPT-3,一個 1750 億參數的語言模型
http://www.open-lab.net/zh-cn/blog/openai-presents-gpt-3-a-175-billion-parameters-language-model/
Tue, 07 Jul 2020 04:19:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4909
Continued]]>
OpenAI 研究人員最近發布了 研究報告 描述 GPT-3 ,一個由 1750 億個參數組成的最先進的語言模型。 相比之下,以前的版本 GPT-2 由 15 億個參數組成。微軟本月早些時候發布了最大的基于 Transformer 的語言模型,該模型由 170 億個參數組成。 “ GPT-3 在許多自然語言處理數據集上取得了很好的性能,包括翻譯、問答和完形填空任務,以及一些需要動態推理或領域調整的任務,如解譯單詞、在句子中使用新單詞或執行 3 位數算術,”研究人員在其研究報告中表示 紙張 “我們發現, GPT-3 可以生成新聞文章樣本,人類評估人員難以將其與人類撰寫的文章區分開來。” 自然語言處理任務從生成新聞文章、語言翻譯到回答標準化測試問題。 該組織表示:“每個模型的精確架構參數是基于計算效率和 GPU 模型布局中的負載平衡來選擇的。
Source
]]>
4909
人人超碰97caoporen国产