OpenAI將開源SimpleQA新基準,以衡量大模型真實性

當地時間10月30日,美國開放人工智能研究中心(OpenAI)宣佈,爲了衡量語言模型的真實性,將開源一個名爲SimpleQA的新基準。該基準可衡量語言模型回答簡短的事實尋求(fact-seeking)問題的能力。