OpenAI首批王炸來了,ChatGPT Pro無限暢用旗下模型,包括“最智能的”o1

本文作者:李丹

來源:硬AI

OpenAI CEO Sam Altman預告的“王炸”首批出爐:OpenAI推出了一款高端的GPT訂閱套餐ChatGPT Pro。它的收費在OpenAI目前的各產品中最高,提供OpenAI旗下所有模型的無限使用權,包括OpenAI最強推理模型o1及o1系列的一個升級版本。

美東時間12月5日週四,OpenAI確認了稍早一些網傳的消息,正式推出名爲ChatGPT Pro的套餐,每月訂閱收費200美元。OpenAI稱,該套餐的訂閱用戶可以大規模訪問OpenAI旗下最佳的模型和工具,包括無限制訪問OpenAI最智能的模型 OpenAI o1以及同系列較小模型o1-mini、GPT-4o、類人的ChatGPT高級語音模式Advanced Voice。

此外,ChatGPT Pro的套餐中還可以包括名爲o1 pro mode的新o1版本,也是ChatGPT Pro獨有的o1版本。OpenAI稱,這個新版本使用更多的計算,能更深入地思考,併爲最困難的問題提供更好的答案。希望未來爲ChatGPT Pro添加更強大的計算密集型生產力功能。

Altman在社交媒體發帖而極少,OpenAI本週四有兩個新動作,一是在ChatGPT Plus套餐中納入了o1,每月收費20美元,二是推出每月收費200美元的ChatGPT Pro,它可以讓訂閱者無限使用模型、甚至時更智能的o1。

o1 pro mode在數學、科學和編碼方面強於o1 且更可靠

OpenAI認爲,ChatGPT Pro爲研究人員、工程師和其他每天使用研究級智能的個人提供了一種提高他們生產力的新方式,該方式讓他們能處於人工智能(AI)進步的前沿。

OpenAI特別介紹了o1 pro mode,稱ChatGPT Pro提供了OpenAI“最智能模型的一個版本”,“該模型可以思考更長時間,從而獲得最可靠的迴應。”在外部專家測試人員的評估中,o1 pro mode可以產生更可靠、更準確、更全面的迴應,尤其是在數據科學、編程和案例法分析等領域。

下圖顯示,在數學、科學和編碼等具有挑戰性的機器學習(ML)基準測試中,o1 pro mode的表現均勝過o1 和 o1-preview。在數學方面,o1 pro mode得分86,o1 和 o1-preview分別爲78和50,在編碼方面,o1 pro mode得分90,o1 和 o1-preview分別爲89和62,在問答博士級別的科學問題方面,o1 pro mode得分79,後兩者分別爲76和74。

爲了突出o1 pro mode的主要優勢——可靠性更高,OpenAI還提高了評估門檻,要求只有在四次嘗試中四次全部能夠正確回答問題、而不是僅一次答對時,才能算作模型解決了問題。即使在這種高標準要求下,o1 pro mode的表現也明顯強於o1 和 o1-preview。

下圖可見,在以上四次答問都必須正確的標準下,o1 pro mode相比o1 和 o1-preview的優勢更大。數學方面,o1 pro mode得分80,o1 和 o1-preview分別爲67和37,在編碼方面,o1 pro mode得分75,o1 和 o1-preview分別爲64和26,在問答博士級別的科學問題方面,o1 pro mode得分74,後兩者分別爲67和58。