OpenAI 公司推出 MLE-bench 新基準
10 月 12 日訊,科技媒體 The Decoder 昨日(10 月 11 日)發佈博文,報道稱 OpenAI 公司推出 MLE-bench 新基準,旨在評估 AI 智能體在開發機器學習解決方案方面的能力。該基準包括 75 個 Kaggle 競賽,旨在衡量自主 AI 系統在機器學習工程中的進展。這些競賽涵蓋了多個領域,包括自然語言處理、計算機視覺和信號處理等等。(IT之家)
相關資訊
- ▣ OpenAI 推出 SWE-bench Verified 基準,更準確評估代碼生成表現
- ▣ OpenAI推出代碼生成評估基準
- ▣ OpenAI和Meta準備推出具有“推理”能力的新AI模型
- ▣ 中國科技公司推出多款模型與OpenAI的Sora競爭
- OpenAI執行長創立的新創公司 推出新版本個人虹模式別資料裝置
- ▣ OpenAI對手 推出新模型
- ▣ 人工智能初創公司Writer推出新模型與OpenAI競爭 估值達19億美元
- ▣ OpenAI不open!這些中國公司出手
- ▣ OpenAI推出ChatGPT全新界面canvas
- 籌資65億美元 OpenAI推動轉型營利公司
- ▣ AI初創公司Anthropic推出AI基金 加速技術革新大潮
- ▣ OpenAI將開源SimpleQA新基準,以衡量大模型真實性
- ▣ OpenAI前首席科學家llya成立新公司
- 6月基金公司調研忙 這些公司被瞄準!
- ▣ OpenAI推美人工智慧基建
- ▣ OpenAI:推出企業定製 GPT-4 新功能
- ▣ OpenAI宣佈推出名爲canvas的新界面
- ▣ 李開復AI大模型公司零一萬物面向OpenAI用戶推出遷移服務
- ▣ OpenAI創始人支持的加密貨幣初創公司將推出衍生品交易所
- 微軟宣佈與法新創公司Mistral合作推動AI 雖然投資OpenAI被盯上
- ▣ 微軟據悉準備推出新的人工智能語言模型,同谷歌和OpenAI競爭
- ▣ OpenAI 前首席科學家 Ilya 宣佈成立新公司
- ▣ OpenAI計劃推出GPT Store
- ▣ OpenAI 推出 meta-prompt 工具
- 習考察電池公司 陸擬推新能源基建
- ▣ 全球科技早參 | 創業僅11周,OpenAI前首席科學家新公司估值超350億元;OpenAI 基礎設施計劃曝光
- ▣ 債基審批暫停?多家基金公司否認,有基金公司債基已被告知覈准材料
- OpenAI推出新模型 輸入提示可達300頁
- ▣ 用GPT-4“自我糾錯” OpenAI推出新模型CriticGPT