OpenAI新模型亮相 推理能力升級

先前傳得沸沸揚揚的「草莓計劃」(Project Strawberry)爲OpenAI內部使用代號,這次發佈將模型命名爲「o1-preview」和「o1-mini」,儘管和先前模型比起來,反應時間更長,但可以在科學、程式編碼和數學方面,以推理能力解決更加複雜困難的任務和問題。

OpenAI訓練這些模型結合推理技巧,將複雜的問題拆解爲更小的邏輯和步驟,模仿人類思維,在反應前花更多時間思考,並在過程中學會改進自我的思考過程,嘗試不同的策略,認知自身犯下的錯,使用者毋須下進一步的指令就能得到更好的答案。

據官方介紹,這款模型可以提高在競爭性程式設計問題的表現,並在科學問題基礎上超越人類「博士等級」的準確程度。o1系列模型在國際數學奧林匹亞競賽中的正確率爲83%,狠甩前一代模型GPT-4o的13%。

o1系列模型代表AI領域的一大步,但它雖在部分項目更加優秀,但應用上面卻比GPT-4o更昂貴且耗時。OpenAI將o1模型命名爲「o1-preview」(預覽版),代表它仍處於初期階段。

對開發人員來說,存取o1的成本極高,價格爲GPT-4o的3至4倍。在應用程式開發介面(API)中,o1-preview每百萬個輸入符元(token)或模型解析的文字區塊收費爲15美元,每百萬個輸出符元的費用爲60美元。相較之下,GPT-4o每百萬個輸入符元的成本僅5美元,每百萬個輸出符元爲15美元。