o1滿血版最鮮測!這¥1500花得值嗎?
o1滿血版這次不搞灰度了,發佈僅4個小時後,已推送給所有(付費)用戶!
手快的網友已經耍起來了~
不過這次推出了更高級的Pro模式,每月200美元的定價也着實讓人望而卻步。
Pro模式和正式版o1究竟有啥區別,將近1500元的價格到底值不值?
許多好心人已經交錢幫大家測了。
如果讓它完成一個數獨,足足能思考5分30秒。
AI在思考過程中依然會犯許多錯誤,但這次區別在於它有了自我糾正的能力,直到得出正確答案爲止。
花了這麼多錢,那對它的期待必然是很高的,有人上來就是一個“請治癒癌症”。
AI也是毫不客氣,直接在思維鏈中接下“正在治癒癌症”這個任務。別管結果如何,就衝它真的努力去嘗試一點,就值得點贊。
26秒過後,o1 pro給出了它的詳盡答案:
正如奧特曼強調的:Pro模式的優勢在於,它可以更加努力地去思考最困難的問題。
o1 pro模式,1500值不值?
再來看另一個與生物醫學有關的問題,o1 pro模式找出了同時滿足6個複雜條件的特定蛋白質,用時53秒。
當然,如果真的給它一個超出能力範圍的問題,它在努力思考過後也會適時放棄。
o1正是之前內部代號“草莓”的模型,這次“strawberry裡有幾個r”是大概率難不住它了。
甚至能夠全程不提這個單詞的情況下,把“strawberry中有3個r”這層意思用詩表現出來。
我們嘗試把這首詩再餵給一個新的o1對話,發現它也能夠理解這首詩想說什麼,且給出了另一個符合條件的答案“Rasberry”(也就是樹莓派的那個樹莓),並且把詩翻譯成中文。
爲什麼它沒有想到Strawberry呢?展開思維鏈,發現它其實也考慮到了草莓,但決定“無核”這個描述更符合樹莓,畢竟草莓表面還是有籽的,樹莓的籽更小且藏在裡面。
另外我們還發現,把詩翻譯成中文這個指令,居然無需佔用推理token,解謎完成後思考就結束了。
它很強,但也會出錯,會把6個手指的手當成完全正常的。
鑑於AI生圖也經常畫出六個手指,人類的手指對AI來說就這麼難嗎?
所以到最後,200美元到底值不值?奧特曼也給出了官方回覆:
絕大多數人用免費版或20美元版就足夠了,200美元版只適合很小一部分人,他們想要大量使用,且願意爲解決真正困難的問題付更多錢。
20美元版o1也很強
如果確實不想一個月花200美元,20美元版o1也足夠強。
現在它可以接受視覺輸入,基於圖像推理了。
有人把十年前的XKCD諷刺漫畫發給它,當時需要5年才能解決的代碼,這回o1當場就給寫出來嘍。
再來看看這個繞得腦殼疼的問題:
出題者稱ChatGPT 4o、o1-mini、Claude 3.5 Sonnet做三次錯三次,而o1是做三次對三次!
至於爲什麼《最終幻想》符合要求,同樣可以讓o1自己來解釋。
One More Thing
o1正式版以及o1 pro模式,只是OpenAI 12天直播發布計劃中的第一份大禮。
明天凌晨2點,新發布還將繼續。
鑑於o1正式版目前只發布在ChatGPT應用上,API接口還未開放。
並且已有人ChatGPT的前端代碼中扒出GPT-4.5的存在。
不少人預測,下一場發佈將是GPT-4.5和對應API,以便與隔壁Claude競爭,搶佔開發者市場。
參考鏈接:[1]https://x.com/liambolling/status/1864761137436537139[2]https://x.com/__nmca__/status/1864739625140654469[3]https://x.com/goodside/status/1864806604735955080[4]https://x.com/emollick/status/1864744770695815234