上海人工智能實驗室喬宇:大模型從“小而美”到“大力出奇跡”,具身智能是未來重要增長點

在全球科技創新不斷提速的當下,人工智能技術正迎來新一輪突破性發展。

12月25日,上海人工智能實驗室領軍科學家、上海創智學院副院長喬宇,在2025中國信通院深度觀察報告會華東分會場上解讀了大模型的“上半時”,預測了大模型的“下半時”。

大模型,從“小而美”開始

在新一輪人工智能的發展浪潮中,深度學習方法無疑起到了核心的推動作用。

自2010年起,深度神經網絡迎來了重要的技術突破,這一時期,科研工作者們主要集中在構建針對特定任務的專用模型上,這些“小模型”能夠高效地完成如人臉識別、物體檢測及智能交通等領域的具體工作,但它們的功能相對單一,專注於解決某一類問題。

“在最初的10年我們最重要是在端到端做專用模型,也就是大家現在說的很多小模型,它只會幹一件事情。”喬宇說。

隨着時光步入2020年,人工智能領域迎來了一個轉折點——GPT-3的問世。作爲大模型的里程碑式成果,GPT-3不僅展示了通過擴展模型規模(包括參數數量和訓練數據量)來實現所謂的“智能涌現”的可能性,而且爲通向通用人工智能(AGI)開闢了一條全新的路徑。

“當我擴大模型的規模,包括參數規模、訓練數據規模的時候,這個模型就具有了‘智能涌現’能力,所謂‘智能涌現’在我看來就是訓練的時候不會的任務,在測試的時候你Promote一下它好像什麼都會做了。”喬宇表示。

通用人工智能,這個曾經在學術界缺乏統一定義的概念,在過去多年間鮮少被提及,主要是因爲當時的技術條件尚未成熟,無法支撐起對於真正意義上的人工智能的整體實現。

傳統觀念中的AI往往是將人類的認知能力分解爲視覺、語言、聽覺等多個獨立模塊分別進行模擬,而真正的AGI應當是一個有機的整體,它能夠像人一樣綜合運用各種感官和認知能力來理解和應對複雜的世界。

“AGI並不是新詞彙,大家想起來在5年前、10年前我們很少談這個詞,主要兩個原因:一是學術上對AGI並沒有絕對明確的統一定義;二是那時候我們並沒有實現AGI大家公認技術路線。”喬宇補充道。

GPT-3的出現以及隨後ChatGPT對公衆的廣泛推廣,標誌着我們正逐步接近這一理想狀態,同時也引起了產業界與政府部門的高度關注。“這件事情背後重要性就開闢了一條發展通用人工智能AGI的重要路線。”

“大力出奇跡”的模型路線還將延續

在新一輪人工智能發展的浪潮中,喬宇指出兩大趨勢將深刻影響未來的AI技術路徑。

首先,隨着“Scaling Law”(規模法則)的持續推進,即通過增加模型規模和算力投入來實現性能提升的大模型路線,將繼續引領行業發展。“大力出奇跡”的理念使得模型越大、算力越多,效果就越好。“這條路線還會再延續。”

但是,喬宇也強調了這條路線面臨的挑戰:“這麼大的算力不僅意味着巨大的經濟投入,其能耗問題同樣不容忽視。”他進一步解釋道,“隨着模型規模的不斷擴大,能源消耗成爲制約其可持續發展的重要因素。因此,如何在保持高性能的同時降低能耗,成爲了亟待解決的問題。”

第二個趨勢是關於大模型的可信性和安全性。喬宇提到,“大模型的可信、安全以及可解釋性一直沒有得到很好的解決。”儘管大模型在多種任務上表現出色,但在實際應用中,它們往往顯得“通而不專”,即在外行看來像內行,但內行使用時卻發現其表現並不穩定,難以作爲可靠的生產力工具。

“現在大模型往往是通而不專,外行看起來像內行,內行用起來又像外行不能很穩定應用影響落地。”這一現象限制了大模型在專業領域的廣泛應用。

針對上述挑戰,喬宇認爲,兩條路線之間並非競爭或替代的關係,而是互補共生。“我們不是要回到傳統的邏輯、符號計算去代替大模型,而是利用這些傳統技術所研發出來的模型和能力,來解決大模型當前發展中的瓶頸。”他提出,結合傳統技術與大模型的優勢,將是未來AI發展的重要路徑。“我認爲兩條路線的結合是未來重要發展路徑。”

“具身智能“將是未來重要的增長點

喬宇指出,多模態模型之後,具身智能將成爲未來重要的增長點。具身智能的發展不僅僅是多模態大模型的延伸,更是通過與人形機器人等物理智能體的結合,幫助我們解決現實世界生產生活中的各種問題,從而大大拓寬通用人工智能(AGI)技術的應用邊界。

喬宇進一步解釋了人工智能發展路徑的獨特性:“我們可以看到,人工智能的發展是從語言到多模態再到具身,而生命智能的發展實際上走了一條相反的路線。”

喬宇提出了一個引人深思的問題:“爲什麼我們現在的人工智能發展路徑與生物智能的發展路徑恰好相反?”

他認爲,核心要素在於數據。“數據和算力是驅動人工智能發展的重要因素,我們現在能夠掌握的大規模、高質量數據最多的是文本,這得益於互聯網的發展。”

他解釋道,“其次是圖像和視頻,雖然數據量很大,但分佈不均勻,質量參差不齊,因此相對而言要差一些。至於具身智能,由於受制於傳感器等技術限制,數據獲取更加困難。”

喬宇強調,數據的儲備量和可獲取程度在很大程度上決定了當前人工智能發展的技術路線。“正是因爲我們擁有豐富的文本數據,使得自然語言處理取得了顯著進展;而隨着圖像和視頻數據的質量不斷提升,多模態模型也逐漸嶄露頭角。”

然而,具身智能的發展仍面臨諸多挑戰,如傳感器技術和數據採集的侷限性,這些都需要進一步突破。

展望未來,喬宇認爲,具身智能將是人工智能發展的下一個重要階段。“通過將AI與物理智能體相結合,我們可以創造出更加智能化的機器人,它們不僅能夠在複雜的環境中自主行動,還能與人類進行有效的互動和協作。”

最後,喬宇表示,這不僅是技術的進步,更是對人類社會生產力的一次革命。“我們期待着具身智能能夠爲各個領域帶來更多的創新和變革,推動人工智能進入一個全新的時代。”