OpenAI大重啓:新模型想讓你相信ChatGPT像人思考
9月13日消息,經過數週的猜測與期待,OpenAI終於推出了其首個“推理模型”o1。這款產品被認爲是該公司迄今最強大的人工智能產品之一,其解決問題的能力表現出前所未有的類人思維特質。至少,這是該公司對外的宣傳。
不過,和OpenAI以往的研究和產品發佈一樣,o1目前仍有些“吊胃口”。OpenAI聲稱,這個模型在處理複雜任務時表現更加出色,但卻幾乎未透露模型訓練的細節。目前,o1僅向付費ChatGPT用戶和特定程序員提供有限預覽。
OpenAI信心滿滿地表示,o1在物理、化學和生物等領域已經展示出類似博士生的思維深度。這一進展被認爲如此重要,以至於OpenAI決定從現有的GPT-4重新開始,將模型的編號重置爲“1”,甚至考慮捨棄已被廣泛認可的“GPT”品牌。這一品牌不僅定義了其聊天機器人,還標誌着整個生成式人工智能領域的騰飛。
OpenAI今天發佈的研究報告和博客文章,展示了許多o1在應對複雜推理任務上的驚人能力。這些任務涵蓋高等數學、編程難題、密碼解密,甚至包括來自遺傳學、經濟學和量子物理學領域的專業問題。大量圖表顯示,o1在公司內部評估中,已顯著超越了其頂尖的語言模型GPT-4o,在編程、數學及科學領域表現尤爲突出。
這些進步的關鍵源自對兒童教育的深刻洞察——“三思而後行”。OpenAI稱,OpenAI o1在作答前會花費更多時間進行“深思熟慮”,類似於人類的思考過程。公司將這一過程稱爲“思維鏈”,這是一個AI研究中的術語,指將問題分解爲多箇中間步驟的解決策略。這個“思維鏈”機制使模型能夠逐步解決小任務、自我修正並優化解決方案。當用戶向o1提出問題時,模型會顯示“思考中”,隨後展示其推理過程中的一些步驟,如“追溯歷史演變”或“整合證據片段”。最終,它會標註思考的時長,例如“思考9秒”,然後給出答案。
儘管o1在生成答案時的完整“思維鏈”對用戶不可見,以簡化用戶體驗,但這也犧牲了部分透明度,使得用戶難以瞭解模型如何得出最終的結論。這同時也是爲了保護模型的核心技術不被競爭對手掌握。關於o1的構建細節,OpenAI透露甚少,僅表示其訓練基於“全新的優化算法和訓練數據集”。
儘管OpenAI的營銷力度空前,但o1是否會爲ChatGPT帶來革命性體驗,或僅是對現有模型的漸進式改進,仍不確定。不過,從公司展示的研究成果和我的初步測試來看,o1的輸出結果確實更爲全面且富有邏輯。這反映了OpenAI對規模效應的信心:更大的AI模型、更多的數據以及更強大的計算能力,將推動AI性能的飛躍。訓練時間越長,o1的表現越出色。
然而,長時間的思考也伴隨着更高的成本。OpenAI允許程序員支付使用其技術,而o1的每個詞輸出費用大約是GPT-4o的四倍。生成式AI所需的高性能芯片、電力及冷卻系統都極爲昂貴。爲了滿足這些龐大的計算需求,科技公司、能源企業和其他行業預計將投入數萬億美元。這引發了人們的擔憂:AI是否會像加密貨幣或互聯網泡沫時代一樣,成爲新的泡沫。由於o1響應問題所需的時間更長,其消耗的資源也隨之增加,這進一步加劇了AI技術何時能盈利的不確定性。
這延長的處理時間,最顯著的影響或許並不是技術或財務方面的負擔,而是對品牌的重塑。相比過去AI模型中那些晦澀的術語如“轉換器”和“擴散”,OpenAI的“推理模型”以及“思維鏈”聽起來更貼近日常語言,帶有一種“人類化”的色彩。
這種語言策略並非OpenAI獨有。初創公司Anthropic將其主打模型Claude形容爲擁有“性格”和“頭腦”,谷歌大肆宣傳其AI的“推理”能力,AI搜索初創公司Perplexity則宣稱其產品“理解你”。OpenAI的博客直接指出,o1“像人類一樣思考”,“如同真正的軟件工程師一般工作”,並且“具備類似人類的推理能力”。儘管研究負責人強調,OpenAI並不認爲其產品等同於人類大腦,但他也承認,o1在某些方面確實比之前的模型顯得更“人性化”。
對於一個產品定位尚不清晰的行業來說,“人性化”的表達方式無疑是一種有力的營銷手段。智能的定義本來就模糊不清,而語言模型的實際價值也難以確切評估。“GPT”這個名稱看似簡單,卻難以傳達任何實際含義。儘管OpenAI的首席研究官鮑勃·麥克格羅(Bob McGrew)認爲,OpenAI o1是邁向“更合理命名”的第一步,旨在更清晰地表達其產品,但這些字母和數字組合的微妙差異對普通人來說往往無關緊要。
然而,推銷一種能夠“像你一樣思考”的工具,與科學實驗室的術語完全不同,它更像是文學中的概念。這樣的描述固然不比其他AI術語更精確,甚至可能更模糊,但也正因此賦予了其獨特的魅力。一個聲稱“像人類思考”的AI模型,爲人們留下了想象的空間,讓每個用戶都能填補其中的空白,構想出一臺“像我一樣運作”的機器。或許,銷售生成式AI的關鍵就在於此——讓客戶自己去構築和填補這其中的“魔法”。(小小)