o1滿血版最鮮測!這¥1500花得值嗎?

o1滿血版這次不搞灰度了,發佈僅4個小時後,已推送給所有(付費)用戶!

手快的網友已經耍起來了~

不過這次推出了更高級的Pro模式,每月200美元的定價也着實讓人望而卻步。

Pro模式和正式版o1究竟有啥區別,將近1500元的價格到底值不值?

許多好心人已經交錢幫大家測了。

如果讓它完成一個數獨,足足能思考5分30秒。

AI在思考過程中依然會犯許多錯誤,但這次區別在於它有了自我糾正的能力,直到得出正確答案爲止。

花了這麼多錢,那對它的期待必然是很高的,有人上來就是一個“請治癒癌症”。

AI也是毫不客氣,直接在思維鏈中接下“正在治癒癌症”這個任務。別管結果如何,就衝它真的努力去嘗試一點,就值得點贊。

26秒過後,o1 pro給出了它的詳盡答案:

正如奧特曼強調的:Pro模式的優勢在於,它可以更加努力地去思考最困難的問題。

o1 pro模式,1500值不值?

再來看另一個與生物醫學有關的問題,o1 pro模式找出了同時滿足6個複雜條件的特定蛋白質,用時53秒。

當然,如果真的給它一個超出能力範圍的問題,它在努力思考過後也會適時放棄。

o1正是之前內部代號“草莓”的模型,這次“strawberry裡有幾個r”是大概率難不住它了。

甚至能夠全程不提這個單詞的情況下,把“strawberry中有3個r”這層意思用詩表現出來。

我們嘗試把這首詩再餵給一個新的o1對話,發現它也能夠理解這首詩想說什麼,且給出了另一個符合條件的答案“Rasberry”(也就是樹莓派的那個樹莓),並且把詩翻譯成中文。

爲什麼它沒有想到Strawberry呢?展開思維鏈,發現它其實也考慮到了草莓,但決定“無核”這個描述更符合樹莓,畢竟草莓表面還是有籽的,樹莓的籽更小且藏在裡面。

另外我們還發現,把詩翻譯成中文這個指令,居然無需佔用推理token,解謎完成後思考就結束了。

它很強,但也會出錯,會把6個手指的手當成完全正常的。

鑑於AI生圖也經常畫出六個手指,人類的手指對AI來說就這麼難嗎?

所以到最後,200美元到底值不值?奧特曼也給出了官方回覆:

絕大多數人用免費版或20美元版就足夠了,200美元版只適合很小一部分人,他們想要大量使用,且願意爲解決真正困難的問題付更多錢。

20美元版o1也很強

如果確實不想一個月花200美元,20美元版o1也足夠強。

現在它可以接受視覺輸入,基於圖像推理了。

有人把十年前的XKCD諷刺漫畫發給它,當時需要5年才能解決的代碼,這回o1當場就給寫出來嘍。

再來看看這個繞得腦殼疼的問題:

出題者稱ChatGPT 4o、o1-mini、Claude 3.5 Sonnet做三次錯三次,而o1是做三次對三次!

至於爲什麼《最終幻想》符合要求,同樣可以讓o1自己來解釋。

One More Thing

o1正式版以及o1 pro模式,只是OpenAI 12天直播發布計劃中的第一份大禮。

明天凌晨2點,新發布還將繼續。

鑑於o1正式版目前只發布在ChatGPT應用上,API接口還未開放。

並且已有人ChatGPT的前端代碼中扒出GPT-4.5的存在。

不少人預測,下一場發佈將是GPT-4.5和對應API,以便與隔壁Claude競爭,搶佔開發者市場。

參考鏈接:[1]https://x.com/liambolling/status/1864761137436537139[2]https://x.com/__nmca__/status/1864739625140654469[3]https://x.com/goodside/status/1864806604735955080[4]https://x.com/emollick/status/1864744770695815234