OpenAI資助AI數學基準測試引發公正性質疑
近日,AI社區對OpenAI資助的數學基準測試FrontierMath的公正性提出質疑。FrontierMath是由Epoch AI組織開發的一項用於評估AI數學能力的測試,OpenAI在展示其新人工智能o3時使用了這一基準。Epoch AI透露,OpenAI不僅資助了FrontierMath的創建,還參與了基準問題的審覈,但這一合作直到去年12月20日才被公開。
部分社區成員擔心,OpenAI的參與可能影響FrontierMath的公正性,尤其是OpenAI可能獲得了對基準的優先訪問權。Epoch AI副主任Tamay Besiroglu承認未能及時公開合作信息,影響了透明度,但他強調FrontierMath的完整性並未被破壞。儘管如此,Epoch AI的首席數學家Ellot Glazer表示,尚未獨立驗證OpenAI在FrontierMath上的表現,未來將進行獨立評估以確認其準確性。
免責聲明:本文內容由開放的智能模型自動生成,僅供參考,不構成任何專業建議或決策依據。用戶應自行覈實信息的準確性和可靠性,本站對用戶因使用或依賴本文內容而產生的任何風險或損失不承擔任何責任。如有疑問或發現內容有誤,請聯繫本站進行處理。