大模型下一步在哪裡?王小川、楊植麟等給出回答

作者 | 劉寶丹

編輯 | 周智宇

AI大模型是正在進行的新一輪技術革命,它最終能否通向AGI,在技術研發和商業落地之間該如何權衡,這是當下需要釐清的核心議題。

6月14日,在2024北京智源大會上,百川智能CEO王小川、智譜AI CEO張鵬、月之暗面CEO楊植麟、面壁智能CEO李大海等給出了最新的思考和判斷。從理論研究層面來看,業內的共識是大模型可以通向AGI。

楊植麟認爲,大模型是第一性原理,需要不斷提升模型的規模,它本質上是一個壓縮,但這個壓縮可以產生智能,隨着不斷規模化這個模型,不斷做更好的壓縮,它能產生越來越多的智能。

張鵬認爲,目前,大模型在很有效地發揮作用,Scaling Law還在往前推進。李大海也認爲,大模型一定是通往AGI這個方向上當前所有技術裡能走得最遠的。

不過,大模型是否是AGI的唯一答案,目前還很難說。

張鵬表示,大模型是不是能夠幫助我們推到AGI頂峰上去,現在找不到一個確切的答案。李大海也表示,大模型能不能直接達到,現在還有很多未知因素。

可以確定的是,大模型技術正在進行快速迭代,而隨着技術能力的提高,大模型面臨的挑戰也越來越大。

楊植麟認爲,Scaling Law會持續演進,只是在這個過程中要Skill的方法可能會發生很大的變化。

在楊植麟看來,最大的挑戰是數據,在數據沒有那麼多的領域,或者假設最後要做出來一個比人類更好的AI,可能根本不存在這樣的數據,現在所有的數據都是人產生的,最大的問題是怎麼解決稀缺甚至不存在的數據。

李大海認爲,現在的大模型作爲知識壓縮,主要是在處理人的大腦系統1的工作。(來自《思考快與慢》,系統1是一種快速、直覺、自動的思維方式,系統2是一種緩慢、邏輯、努力的思維方式。)系統2的能力是未來大模型通過agent技術外部化或者把它內化爲自己的能力,這是需要大家去探索的。

王小川認爲,今天我們把語言放到大模型裡,變成了數學,語言在符號主義和連接主義之間產生了突破,再往後走,還必須有範式改變。

他的結論是,以現在公開的Scaling Law,還做不到AGI。“Scaling Law之外還有範式的變化,比如數據、算法、算力,不只是去簡單地變成壓縮模式,走出這個體系,纔有機會走向AGI。”

在大模型技術演進的同時,創業公司也在摸索落地應用和場景,大模型價格戰就是這種心理的一個反映。

“價格戰對中國發展大模型非常特別,我是積極看待這個事情。”王小川認爲,價格戰可以讓更多公司和人用上大模型,使得大模型在中國有個迅速的普及。此外,價格戰之後,很多企業退回來成爲大模型的用戶,減少資源的浪費。

張鵬也認爲,當有一天AI大模型能力變成像水、電這樣的基礎能力時,企業會擁有更好的發展空間和態勢。

李大海認爲,價格戰多少有一些營銷成分在,但是未來大模型價格一定會比現在還要低,而且大家都有利潤,這纔是健康的方式,才能讓千行百業的應用往下落地。

對創業者來說,AGI是願景,ROI是企業生存的前提,從商業模式上驗證大模型的能力同樣重要。

楊植麟認爲,改變商業模式本身或者ROI很重要的方式,還是要看大模型的成本和產生的實際價值。

他判斷,有三個時間點很重要,一是推理算力顯著超過訓練算力;二是,從C端的角度來說,推理成本可能會顯著低於獲客成本;三是,AI本身做的事情超過人做的事情,會產生新的商業模式。

“它可能不是像今天說的在B端用API做價格戰,可能是一個普惠的AI,同時根據它產生的價值從這裡面去分層產生的商業模式。”楊植麟如是表示。

縱觀技術發展的歷史,很少有一個技術像AI大模型一樣,技術迭代和商業模式幾乎同時推進,這也意味着,技術帶來的商業化時間窗口轉瞬即逝,競爭難度可想而知。

一場前所未有的基於動態大模型技術的商業之爭將愈演愈烈。