每經專訪第四範式董事長戴文淵:澄清AI熱潮背後的誤解,向“無窮大”前進

每經記者:可 楊 每經編輯:張海妮

由史蒂文·斯皮爾伯格(Steven Spielberg)執導的電影《人工智能》,講述的是一個小男孩最終發現自己是人工智能的故事。

人工智能什麼時候才能達到這樣的水平?難道人工智能的作用就是製造一個類人智能體嗎?這是第四範式創始人、董事長戴文淵投身人工智能產業早期最令他迷惑的兩個問題。

最終,他在圖靈獎獲得者詹姆斯·尼古拉·格雷(James Nicholas Gray,暱 稱 Jim Gray)2007年《科學發展的四個範式》的演講中找到答案。其中,第四範式階段是指數據科學——隨着數據爆發式增長以及技術演進,科學理論由計算機從海量數據中發現。

視覺中國

戴文淵所創立的人工智能公司“第四範式”的名字也由此而來。這家成立於2014年的企業級人工智能平臺企業,迎着人工智能的潮起與潮落成長至今,作爲掌舵者,戴文淵向《每日經濟新聞》記者分享的心得是,不要太在乎AI(人工智能)是不是能做所有事,或者不能做所有事,因爲這對於市場來說也不重要,客戶關心的問題是:“我是賣雞翅的,AI能做的所有的事情,跟我有什麼關係?重要的是我的雞翅能不能(通過AI)賣得更好。”

大模型時代,第四範式主張對模型進行“剪裁”,以求用最“經濟”的方式做領先的AI。在戴文淵眼中,通用大模型和行業大模型是實現AGI(通用人工智能)的不同路徑,區別在於是用一個模型去實現AGI,還是用很多模型去實現AGI。而兩相比較之下,行業大模型是他認爲最經濟的方式。

熱潮與誤解一同翻涌,市場期望AI解決所有問題

新的熱浪翻涌在第四範式成立的第十年,這也促使戴文淵作出了一些改變。

2023年,很多人找到戴文淵,問他:“ChatGPT會怎麼幫助到我的企業?”上一次他被問及類似的問題是在2016年,那時,問句的主語是AlphaGO。

更有趣的是,這一次,幾乎所有的客戶、投資人、媒體記者都在使用“技術的語言”來提問,“參數”成爲高頻詞,與之前的狀況大不相同。

戴文淵說:“要把AI做好,就先不要談AI的問題,先談談公司是做什麼的,把這些問題談清楚,咱們再回頭看看AI是不是可以(對公司)有幫助。”

市場和客戶都對新技術感到興奮時,戴文淵希望能借此機會引導一個正確的“AI價值觀”:“不能先把參數做到一千億,再想這千億的參數到底能幹什麼?”

市場期望AI解決所有的問題,這反映了一種恐慌心理:萬一 AI能做但是自己沒有用到,那可能會失去一些機會。戴文淵將此視爲一個機遇,“擔憂”打開了世人想要了解AI的窗子,但誤解也同熱潮一同翻涌,第四範式要做的,是把AI的價值帶到衆人面前。

ChatGPT,這個目前最火爆的大模型應用,將大模型帶到了人工智能圈層以外的世界。熱浪之下,一些人對於大模型的理解或許是:和ChatGPT一樣的技術。

直至今天,市場中最受關注的大模型依舊是以大語言模型爲主,即“預測下一個字”的模型,年初爆火的Sora則是“預測下一幀畫面”的模型。

但應用是更加實際的事,對於絕大多數企業而言,“預測下一個字”解決不了核心問題。例如,金融機構需要解決風控問題,但這不是語言問題;大語言模型可能會輔助金融機構解決客服事宜,但這可能不是它的核心問題。真正的行業大模型應當是針對不同場景,構建不同模態,去預測下一個“事情”。

這背後有一個更大的誤解——很多人問,能不能基於開源大模型底座或GPT,訓練行業需要的新模態模型。但即使同樣出自OpenAI之手,要在GPT模型上直接精調出Sora,也是不可能的事情。

戴文淵介紹,大多數行業大模型是要基於特定業務所積累的特定模態的數據,訓練出一個基座大模型,就像目前訓練底座的大語言模型、視頻模型一樣。

行業大模型這件事,其實已經發生了十年之久。2014年,第四範式推出人工智能平臺——先知1.0,用建模型的方式,挖掘業務數據價值,提升業務效果。如今“先知”已經迭代到了5.0版本,定位於降門檻,讓企業自行構建高價值場景所需的行業大模型,例如預測疾病風險、欺詐行爲、災害險情、設備故障等,打破大語言模型只能生成文字、圖像、視頻的侷限。

信心不再是問題,但市場的耐心有限

1956年夏天,在達特茅斯學院舉辦了一場人工智能研討會,主題是研究“讓機器能像人那樣認知、思考和學習,即用計算機模擬人的智能”。這次會議被普遍視爲人工智能技術的起點。由此出發,人工智能開始沿着一條波浪式的曲線前進,經歷着巨大的潮起與潮落,穿梭在失望與希望之間。

兩到三年,戴文淵認爲這是市場能給一場技術熱潮的最大耐心。

距離我們最近的一次潮起被認爲來自2016年,基於強化學習算法的AlphaGo戰勝人類圍棋選手李世石,“機器是否會代替人類”在彼時引發市場關注,商湯科技、曠視科技等一批人工智能“獨角獸”站到臺前。

第四範式是一家幸運的公司,這家公司誕生於2014年,從誕生的第一天就開始做企業端的生意。不過那時候,很多企業告訴戴文淵,他們沒有人工智能預算。隨着AlphaGO成爲那枚投向平靜水面的石子,突然之間,所有客戶都來問他:“你們是人工智能企業,你來給我講一講AlphaGO可以幫我做什麼?”“我們有預算,我們要AlphaGO。”

兩三年的時間,人們理想中的人工智能工具沒有誕生,市場信心在2019年崩盤。據獵豹全球智庫數據,與2018年相比,2019年中國人工智能企業的融資金額由1484.53億元下降至967.27億元,下降幅度達到34.8%,融資數量也由737個下降至431個,下降幅度達四成。

直到ChatGPT成爲下一顆石子,這場“寒冬”結束,AI市場再度迎來熱潮。

戴文淵認爲,在2023年以前,市場對AI是信心問題。從2023年開始,不再是信心問題,而是要找到正確路徑的問題。“不用擔心客戶認爲AI沒有用,需要解決的是,引導客戶反過來想業務的問題。”戴文淵說。

潮起潮落,似乎已經成爲人工智能行業的常態。潮爲什麼落,戴文淵認爲和價值相關。2016年,每家企業都陷入“怎麼去用AlphaGO幫助到我”的問題中,這個潮落了。今天也一樣,如果每家企業想的都是“怎麼用ChatGPT幫助到我”,可能這個潮也會落。

戴文淵判斷,兩三年內,如果大模型不能創造出巨大的價值,可能就會再度潮落,等待下一顆“石子”——或許是一個新的能夠吸引眼球的東西,或許是能夠在合理的投入產出中創造出足夠價值的技術。

當下的機遇是市場的目光重新被吸引,但挑戰在於,兩到三年內能否兌現大模型的價值?

市場關注到人工智能“+”,戴文淵認爲這個加號非常重要,這意味着,未來兩到三年,人工智能有可能創造出很大的價值,如果大家想的都是ChatGPT能不能幫到企業,不見得能創造市場預期的價值。

“以語言模型爲例,去年主要的落地場景都與客服相關,如果在這麼大的關注度之下,落地的應用全是問答類場景,可能兩三年以後大家就失望了。”他說。

AI是一個實驗的過程,目標是提升“北極星指標”

目前來看,大模型賦能行業,依舊是一個充滿前景的故事,因爲理論上不存在大模型無法賦能的行業,人效上可以充分發揮想象力。

目前,絕大多數企業的核心業務都由人來作決策,但人作決策時往往面臨兩個困境:水平參差不齊、精力有限。當AI能力提升,哪怕其能力尚未全面超越人類,即便僅達到人類的平均水平,但如果能複製很多“人”,就很有可能提供更好的業務價值。

企業招聘員工時,並非需要每個員工都達到頂尖水平,而是注重每個員工是否能爲企業帶來積極的貢獻。因此,戴文淵認爲,儘管第四範式的目標是使AI的表現超越絕大多數業務專家,但從實踐角度來看,AI即使僅僅達到專家平均的能力水平,也有可能爲企業帶來顯著的價值提升。

從數字化時代開啓到數智化時代來臨,賦能傳統企業與實體經濟始終是市場對技術的期待。隨着大模型來臨,數字技術從傳統的信息蒐集、傳輸、整理、儲存,逐漸走到輔助決策甚至替代決策階段。

戴文淵指出,一些企業當前在使用AI時,依舊存在數字化時代的慣性思維,即過於依賴同行業的成功案例,試圖直接移植成熟方案落地到本企業。但實際上AI和企業核心競爭力相關以後,不同企業的目標是不一樣的。

理想狀態下,大模型應該能夠幫助企業完成核心決策。爲此,第四範式將企業的戰略目標轉化爲計算機可以記錄和跟蹤的語言,即企業的“北極星指標”,以此作爲企業最核心的關鍵指標。

戴文淵認爲,對於企業而言,在使用AI前,需要先想明白一點:對於提升“北極星指標”,什麼叫好,什麼叫不好。以實體零售企業爲例,其核心效率體現在每平方米所貢獻的效益上,這可能就是一家零售企業的“北極星指標”。所有圍繞這一指標的改進,都需要量化其對“北極星指標”的實際影響,無論是提升還是下降。

在實踐中,AI的應用並不意味着每一步都能帶來提升。

“AI其實是一個實驗的過程。”戴文淵舉例,假設有一百萬的客戶基礎,可能將九十萬作爲基線,剩餘的十萬,每一萬作爲一個實驗組,持續嘗試模型的優化與迭代。“早期的實驗基本上是成功的,每次實驗都會比‘九十萬’更好。但是到了一定階段絕大多數的實驗都是失敗的,也沒有關係,往往到了一定的規模體量以後,一百次體驗如果能成功一次,就能賺回前面九十九次失敗的所有成本。”戴文淵說。

AI是一個實驗的過程,這是戴文淵的認知,但尚未在客戶中達成共識。

客戶的認知提升是AI產業發展至關重要的一環。如果認知遲遲沒有發生變化,AI會重新變成“需要有一個大模型、交付一個大模型,這個大模型的參數是不是1000億,是1000億就驗收通過付款、結束”的過程,也許再經過一年半載,客戶會覺得,大模型好像沒什麼用。

這時,熱潮可能將會再度遺憾告終。

AI是科學問題,AI應用是經濟問題

在通往AGI的路上,通用大模型和行業大模型是兩條不同的技術路線。戴文淵認爲,大家都是朝着AGI的方向前進,區別在於是用一個模型去實現AGI,還是用很多模型去實現AGI。

在他看來,用一個模型去解決所有的問題,不是最經濟的。

戴文淵還提出了一個更爲少見的觀點:並不存在真正的通用大模型,所謂的通用大模型,本質是將多種場景融入一個模型中。

第四範式的做法是,進行剪裁,先做垂直的行業模型。如果模型僅針對某一特定場景進行應用,就先通過該場景的數據模態構建專用模型,同樣參數量往往能實現更好的效果。相反,若模型被設計爲一個通用大型模型,最後通用大模型應用到某一具體場景,往往很可能是不經濟的。

“經濟”,在一個小時的採訪裡,戴文淵至少5次提到這個詞。“我們致力於把這個問題(解決),或者把這個技術做出來,如果我選擇了不經濟的一條路,可能最後我會做不出來,我們要綜合考慮每一種方向,每一個路線所面臨的問題,最後找到一個最有可能的解決方法。”戴文淵說。

“做最領先的AI是特別貴的事,需要花很多錢。”或許正因爲如此,在技術信仰派和商業信仰派之爭中,戴文淵認爲自己處於兩者之間。

AI顯然是個科學問題,但做出最領先的AI技術,是個需要計算的經濟問題。

戴文淵認爲,經營一家AI技術公司,需要站在商業的角度思考問題:最領先的AI技術需要海量的算力和數據,如果不能和商業更好(地)結合,那麼長期持續的資金投入將變得難以爲繼,既需要技術又需要商業,如果你要做最好的東西,就必須要都有。

此外,對於AI從業者的自我修養,戴文淵認爲,還需要具備韌勁與恆心,“人工智能就是一個起起伏伏的賽道,可能這兩年又被大家關注到了,甚至被吹上天,被吹上天的時候你不要覺得自己是神仙。同時,被踩到地下的時候,也不要覺得自己沒有價值”。

波浪式前進的過程中,可以肯定的是,通往AGI的道路並沒有一個標準的指路牌。

“AGI是我們所有人的理想,AGI就是我自己心目當中的一個無窮大。”戴文淵從來不認爲AGI是一件三年、五年甚至十年就能實現的事,相反,他覺得,AGI是一件永遠做不到,但永遠都在做的事。