號稱最強端側GPT-4o,面壁李大海的野心是給每個設備裝上“端側大腦”

出品|本站科技《態度》欄目

作者 | 袁 寧

編輯 | 丁廣勝

端側 GPT-4o來了!

1月15日,面壁在海外首發了新一代面壁小鋼炮 MiniCPM-o 2.6,功能上對標 GPT-4o,全模態、端到端,實現視頻語音絲滑交互。最重要的是,他在端上,僅8B 參數。

先說這個新模型意味着什麼?

首先,對標GPT-4o 意味着,模型長了眼睛和耳朵,能夠知道此刻在發生什麼,並持續保持對外界的感知。

換句話說,他不僅能聽懂你說的話,還能看到你的行爲,理解你所處的環境,並實時給出迴應。而這也是GPT-4o當時驚豔大衆的主要原因。

不同的是,MiniCPM-o 2.6用8B的模型參數,實現了將這些功能運行到端側——本地運行、本地存儲,實現個人專屬、數據隱私保護、以及不受網絡限制。

在評估全模態模型音視頻能力的多個榜單上,MiniCPM-o 2.6的能力表現

不同於大部分大模型公司,面壁智能從2024年起就押注端側模型。他們認爲,端側模型具備隱私性好、更可靠、響應快等優勢,具備更早、更快落地的潛力。

據悉,當前,面壁端側模型已經與高通、華爲、聯發科技、聯想、英特爾、長城汽車、易來智能、大象機器人、加速進化、梧桐科技、招商銀行、知乎、西門子、金山辦公等進行了合作。

在剛剛結束的2025CES上,面壁智能 CEO 李大海表示:面壁智能的工作就是聚焦端側模型,我們的願景是所有的設備上都會有端側的智能,都會部署端側的模型。

2025年,大衆對於模型落地的期盼更加強烈。據介紹,端側模型,作爲小語言模型中主要在各類終端中部署的模型,不需要雲端算力,就能以很低的參數量,很小的算力和內存消耗,更高效率的硬件資源運行調度,直接在終端運行。

無論是手機、PC、具身機器人、智能汽車、智能家居,還是AI眼鏡、AI陪伴類寵物。可以預見,端側模型帶來的想象空間都是巨大的。

藉着面壁智能新產品發佈的時機,本站科技等媒體與面壁智能聯合創始人、CEO李大海進行了交流。除了MiniCPM-o 2.6的功能,還進一步討論了與廠商的後續合作計劃,面壁在智能硬件方面的佈局,以及他對大模型企業進入美國實體清單的看法……

以下爲面壁智能聯合創始人、CEO李大海的部分採訪內容,經不改變原意的整理:

提問:從市場競爭角度來看,2.6版本的模型與市場上其他類似的端側人工智能產品相比,核心競爭力體現在哪些方面?

李大海:面壁的全模態端側模型是全世界第一個全模態端側模型,沒有之一,就是第一個。我覺得如果大家看到我們的demo,就會有一個比較直觀的感受。

過去,面壁持續在以技術創新性引領端側模型的發展。在過去一年,我們在多模態端側模型領域持續保持領先,持續的跑得足夠的快,這是我們的最大的優勢。

按照我們曾給大家提過的“大模型知識密度定律”,大模型的知識密度每三到四個月就會翻倍。因此,我們並不追求模型在所有方面始終保持第一,而是專注於發揮技術創新的想象力,爲設備賦能,使其具備人類般的感知和思考能力。這種開創性工作對大模型行業以及智能硬件和機器人產業都有重要價值。

我們的核心競爭力並不完全在模型本身,而是體現在團隊能力、技術願景以及持續推動技術戰略創新的能力上。這些纔是我們的核心競爭力。

提問:針對不同的端側設備,如智能手機、平板電腦和智能穿戴設備,2.6版本是否有專門的適配版本?如何保證在不同設備上的一致用戶體驗?

李大海:基於面壁科技的商業策略,目前開源的2.6版本是相對較大的全模態模型,而針對不同設備的需求,我們還會開發更小的商業化全模態版本。這些更小的模型適用於算力有限的設備,例如智能手機和汽車。需要注意的是,這些小型模型不會開源,而是作爲商業化產品提供。

關於用戶體驗的統一性問題,我們認爲不同設備之間的使用場景差異決定了體驗本身就會有所不同。例如,在汽車場景中,模型的主要功能是提升語音交互能力、環境感知能力以及主動關懷功能;而在手機上,模型可能會更多聚焦於個性化輔助功能。

因此,我們的端側模型並非統一的通用解決方案,而是根據具體場景優化。例如,在與某翻譯客戶的合作中,模型能夠支持十多種語言的實時翻譯,而這一功能顯然與汽車或手機場景的應用需求完全不同。因此,體驗一致性並非設計目標,而是通過針對性優化滿足不同設備和場景的獨特需求。

提問:面壁一直強調和致力的是高效大模型,這個高效和Deepseek們強調的有什麼差異和相同點嗎?

李大海:我們強調和專注於提供高效的大模型,其實高效大模型既體現在訓練上又體現在推理上。我們和Deepseek最大的不同就是他們專注雲端,我們專注端側。

因此,在技術研發中,我們更加註重模型的精簡化與推理效率的提升。而Deepseek則聚焦於通過更大規模的訓練資源追求效果的最優表現。

提問:我們觀察到手機正在向AI手機的方向轉型,包括蘋果它也在自研端側模型,並推動跟國產大模型的合作,想問一下2.6跟這些模型相比,有什麼特點?

李大海:其實現在手機廠商在強調的更多的還是簡單的語言模型和多模態模型,這是兩個不同的物種。

我有一個自己的術語,叫“具身化”,也就是它作爲具身智能的設備存在的屬性有多強。其實當前手機的“具身化”特性沒有那麼強。比如說像汽車,就是個“具身化”屬性非常強的設備。

面壁2.6的核心競爭力在於它的全模態特性,它不僅限於傳統的文本或圖像處理,還能賦予設備感知周圍環境的能力。簡單來說,當前的AI手機更像是爲現有場景優化的工具,而2.6則能讓設備能夠像人一樣的去感知周圍的環境,這是一個非常大的進步。

提問:2.6版本是否有與廠商合作的計劃?落地應用會更傾向哪些類型的產品,比如手機、PC還是智能眼鏡?目前與智能廠商的合作形式是怎樣的?

李大海:當前,我們的模型其實會更關注“具身化”屬性強的設備,例如汽車和機器人等,這些是我們會重點去做的。

具體來說我們我們與“加速進化”等機器人廠商已開展深度合作,能夠爲機器人補全“大腦”這一重要拼圖,實現從感知到思考的全面升級。我們也期待能夠跟更多的機器人廠商能夠一起合作。

提問:您提到過“端側模型+智能硬件”是未來的發展方向。面壁是否計劃建立自己的AI硬件生態,或者面壁與硬件廠商將有什麼深度的合作嗎?

李大海:首先我們還是非常堅定的認爲端側模型加智能硬件是未來發展的方向,我們的願景在端側這個方向上,我們的願景就是,我們希望未來每一個智能硬件上都能通過端側模型,而能夠具備智能。

我們認爲未來的每一個硬件其實都應該是智能化的,這個智能可高可低,但是它都應該是智能化的,這樣才能夠更好的去幫助人類生活。

回到面壁自己的話,我們這個階段還不會去以建設自己的硬件生態這個視角來去看待問題,我們會覺得面壁應該更多的去賦能足夠多的硬件廠商。

首先,我們會廣泛的跟不同AI芯片公司進行合作,讓面壁的模型能夠跑在足夠多的芯片上,因爲我們認爲面壁的模型具有足夠強的通用性,我們是能夠賦能各種各樣不同的設備的。

其次,我們也會基於跟芯片結合好的一個基礎能力,再去賦能更多的設備,讓設備廠商的用戶得到更好的體驗。

在這個基礎之上,我們的落地做得足夠好以後,我們再去談面壁的硬件生態,這個是後一步的事情。

提問:在您的感知來看,國內的大模型初創公司開始進入技術收斂階段了嗎?大家現在開始從訓練端,向推理端轉變了嗎?

李大海:這其實是Scaling law邊際效應縮小,帶給大家的一個主觀感受,但實際並非如此。

大模型公司更重要的還是想象力,就像我們面壁能夠用8B的模型就能達到全模態。我覺得只要一個團隊他能夠看到一個很好的很有價值的技術方向,並在技術方向深挖,並做到行業最好,其實就一定有自己的價值。所以我們覺得其實大模型的技術還遠遠沒有收斂,還是有非常多的方向是值得去深入挖掘的。

所以面壁其實會堅持的聚焦在端側,我們認爲端側非常有價值,也有很多還可以持續深挖的工作。至於您講的逐步減少預訓練,我們認爲預訓練其實還是仍然是非常重要的,只不過我們也看到通過規模擴大,得到的收益其實是在逐步減小的,但這一直都不是面壁的方向,因爲我們關注的是知識密度,所以在那個方向上的影響對我們來說不太存在。所以面壁的預訓練其實從來沒有減少過,我們還會持續的加強在預訓練這個方向的。

提問:昨晚中國第一家大模型企業被列入美國實體清單,這一方面的限制在未來會影響整個國內的行業嗎?

李大海:其實國內算力企業現在的最大的問題是性價比,很多性價比還是不如英偉達的高。但是也因爲這些影響,可以讓國內團隊更沒有了猶豫的空間。

在這種情況底下,我覺得其實對於國內的廠商新算力廠商來說是利好的,整個國內的生態一定會有一段時間的陣痛,但是我相信隨着陣痛的過去,其實我們的整個生態將會變得更強大。

提問:目前可以看到,小模型會是未來一段時間一個比較大的趨勢,面壁要如何樹立自己的護城河?

李大海:首先我覺得競爭是非常的好的事情,其實一個行業如果沒有競爭的話,會是死水一潭,這個領域的領頭羊也會變得沒有進步的動力。

天下武功唯快不破。面壁從24年聚焦端側起,快速發佈了8個端側模型,並全部開源,這些模型在全球的下載量超過400萬次,獲得了超過2萬顆星標。

從第一個端側多模態模型,到第一個端側視頻理解模型,再到今天第一個端側全模態模型,我們始終在技術上引領行業。技術的創新性和快速的迭代是我們最高也是最重要的一個競爭優勢。

基於這些競爭優勢,我們也在行業裡快速落地,我們現在已經跟兩家車廠,達成了深度的合作。此外,我們在PC和手機兩側也都跟國內最頭部的廠商在深度的合作,這是面壁在端側上的一個非常好的競爭情況。

提問:您覺得2.6出現會對整個人工智能產業鏈產生哪些影響?上下游產業中哪些環節會因爲這款產品迎來發展機遇?

李大海:2.6版本的發佈其實標誌着端側全模態技術進入了一個全新階段,從這個角度上我們工作是開創性的。

它不僅吹響了全模態端側模型競爭的號角,還開創性地推動了具身化設備的智能化發展,賦予它們更接近人類的感知和思考能力。在產業鏈上,這種技術進步能夠對機器人和汽車等具身化設備帶來巨大的賦能價值。

大模型的發展的進程是一個馬拉松,我們相信我們還需要持續的去做更多創新性的工作。