對話李笛:大模型已退燒,卷參數沒意義
提起人工智能,一定繞不開一家老牌AI公司——小冰。提到這輪大模型浪潮,更是繞不開一位經常發表“降溫”言論的技術人——小冰公司CEO李笛。
因爲同樣和微軟關聯緊密,小冰公司經常被拿來和OpenAI比較。小冰團隊從2013年開始做AI,2020年從微軟分拆、成立獨立公司,代表產品“小冰”是爲數不多依然活躍的人工智能助手。OpenAI的大股東是微軟,它的ChatGPT則劃出了AI時代的分水嶺。
兩位掌舵人聽起來截然不同的觀點,更是添了幾分博弈的色彩。重掌OpenAI大權的薩姆·奧特曼(Sam Altman)說,GPT-5會更令人驚歎。李笛則因爲“大模型會退熱”的言論,被貼上了看衰大模型的標籤。
“就連我們自己的投資人都說,你是不是反對大模型?”李笛說,自己對大模型真的狂熱不起來,“這一波技術創新去年5月就到此爲止了,應該考慮怎麼把新的技術能力落地,但行業還是在卷大模型,現在一堆大模型都‘爛尾’了”。
日前,小冰公司宣佈已成功獲得“小冰大模型”國內備案,小冰克隆人、歌手克隆人分支等一系列測試產品轉爲正式發佈。這些都是小冰利用大模型的技術能力升級後的產品。
而小冰公司的商業模式沒有變過,一直是“創造人(克隆人),買賣人”,一套人工智能技術框架支撐三種業務,to C的網紅克隆人、歌手克隆人和to B的數字員工。
五年前,我們曾和李笛有過一次長談,那時小冰還沒脫離微軟,李笛的角色是小冰的全球負責人,五年之後再見,小冰公司已經獨立。我和李笛這次對話,他分享了小冰公司在這輪大模型浪潮中的“爲”與“不爲”。
李笛還聊了一些一度讓他頭疼的問題:諸如,賣API不掙錢,怎麼讓AI的價值被認可,把利潤做上去;克隆人如何成爲人的情感紐帶,和人建立長期關係;克隆人在C2C模式下,怎麼規避擦邊和違規風險;小冰要引入外部投資,一個產品經理出身的CEO怎麼和投資人“博弈”……
以下是對話核心內容:
01
2024年,很多人的大模型夢會破滅
問:你去年講大模型會退燒,今年對行業的判斷是怎樣的?
李笛:這波浪潮有一個特別大的特點,准入門檻被降低了,給人一種幻覺,只要暴力地做就有辦法做成,這就有很大的問題。
我的判斷是,今年很多人的大模型夢會破滅。企業終於弄明白大模型不是那麼幫得上我,也就不那麼投入了;大模型公司也終於弄明白,再追求參數,也出不來東西;其他各行各業的,想靠發一個大模型,改變本領域的現有競爭格局,也會發現很難。
問:你的投資人會不會有不同看法?
李笛:去年我們說了我們的判斷,就連我們自己的投資人都說,你是不是反對大模型?
我說一言難盡,當一個新的時代的人出現的時候,他總要找一些“假想敵”。別人總是和小冰做對比,我們其實受到了一定的影響,這決定我們要開始追求一些數字了。坦率地講,我內心並不看重這些數字,但是需要去追求。
最近我跟投資人的交流比較多。投資人有的時候發消息說,你們也應該參加這個榜單。可我認爲,基於榜單做優化太容易了,卷榜沒意義。
但科技企業跟其他行業一個很大的區別是,科技行業特別擔心發表保守言論,特別害怕被認爲是保守的。
可我對大模型真的不狂熱。我們也可以學別人說,“大模型是我們期待已久的時代”,過兩個禮拜以後,光這麼說都不管用了,你得說自己信仰大模型,再過兩個月,你不五體投地一下都不行。但我們不太樂意這麼做。
問:和其他大模型相比,小冰的路線有什麼特別之處?
李笛:我們跟行業裡尤其是國內做大模型的公司,有一個時間差,我們做得比較早一些。
當行業還在爲ChatGPT驚呼的時候,認爲一定要佈局大模型,期待新一波的技術井噴、創新井噴的時候,我們做的更多的是怎麼落地。
這種差異的原因,在於對接下來創新變數的判斷。
我們經歷過AI的幾個週期,我們認爲,創新不是持續的,而是到了一個階段就會陷入瓶頸。這時候應該基於新的技術能力,去考慮落實,而不是再去追逐。
但當時,行業裡尤其是國內行業裡受很多綜合因素影響,熱情高漲。很多入局大模型的人,都是最近三年纔開始做人工智能的。
大模型亂戰,還會導致一些亂象。因爲大模型的成本巨大,所以它跟以前互聯網的“百團大戰”有一個很大的區別,“百團大戰”最後經過資本的整合,可以產生“1+1”的加成效應。我掃這條街,你掃那條街,我們都做一樣的生意,最後一合併,咱們倆就有兩條街。
但是大模型這種技術類產品,產生不了加成效應。我有一個大模型,你有一個大模型,咱們倆一合併,幾乎等同於一個大模型,因爲咱倆的大模型是差不太多的,誰跟誰都拉不開差距。
其實咱們國家不缺算力,缺的是合理的運用。我們的大模型上了日本好幾個榜單的榜首,而且持續好幾個月,參數都不大。我們更關注的是預訓練數據,如何合理地利用好它的模型參數規模。
行業裡現在已經是共識了,落地需要的是中模型、小模型,甚至很多人在考慮端上的模型,我們在去年3月份的時候就這麼說。
所以回答你的問題,小冰一直在做的事情,是基於我們對技術變革的判斷,做的佈局。
我們在去年7月份的時候判斷過一次,認爲今年一季度,這一波技術浪潮基本到此爲止了,會涌現出一些技術上具體的小方法,但不構成結構性的大方法。這一段大模型的技術已經進入到開花結果的階段。
問:是做應用的時機了?
李笛:實際上不是現在,這一波技術創新在去年5月份的時候就穩定了。但是大家還是去卷很大的模型,現在一堆爛尾。所以我不是潑冷水,現在很多人再談應用,其實已經晚了。
我們跟其他卷大模型的公司最大的區別是,很多人現在是給輪子造馬車。而我們不是爲了大模型去想一個適合它的產品,是因爲我們原本有一個產品,用新的技術去迭代,所以我們有更具體的應用場景,有清晰的盈利模式。
問:活下來的是能找到應用需求、有商業模式的?
李笛:沒有能活下來的大模型公司。除非這家公司有一個既有的業務,然後大模型對它既有業務是一種升級。否則,如果把大模型當成公司商業模式的基礎,那活不下來。爲什麼?大模型是個通式,不值錢。它太容易獲得了,誰跟誰都不會差太多。
問:找商業模式,是不是你們這10年裡比較難的任務?
李笛:在2020年分拆出來之前,我們就做過很多商業模式的探索。
2016年,我們在日本服務了一個大客戶,日本第二大超市羅森。我們給羅森便利店做客服機器人,推銷它們的優惠券。
羅森用其他的方法,轉化率都沒有超過10%。但因爲我們機器人的情商高,把優惠券發給用戶後,三天之內有57%的用戶到線下消費優惠券。
羅森從中賺了幾千萬,我們掙多少?每聊一句話,只掙0.2釐。因爲是API調用,即便聊的話創造了很大的價值。我們從那時候感受到,賣API是不掙錢的。
計算機視覺那個時代,有人賣人臉識別API,但不行,所以得賣硬件,做系統集成,做政府項目。那會是一個好結果嗎?
今天大模型公司,技術上沒有什麼獨特性,商業模式沒有變化,我不是很理解他們興奮的點。有人指望着說,我是一個大模型公司,我可以自己做出來一個AGI,但問題是,你要真做出來AGI,還給別人提供服務幹嘛?
02
小冰的商業模式沒變過,一直是“創造人,買賣人”
問:“小冰大模型”獲得國內備案,對業務有什麼改變?
李笛:對於任何公司來講,備案意味着入場券,意味着你可以開始跑了。
有這張入場券的公司很多,好像有五六十家。但是模型跟模型還是不一樣的,有很多公司賣的是大模型技術,小冰從來都不是賣技術的公司,賣的是產品和解決方案。
對於一個賣技術的大模型公司來講,備案通過就非常關鍵了,因爲沒備案,就沒辦法上市銷售,相當於是個三無產品。
而我們沒有任何計劃出售技術,所以備案對我們來講,無非就是規模上的變化,beta標可以去掉了。
問:X Eva的商業模式和一般的to C產品有什麼不一樣?
李笛:國內AI的to C產品有三大類。
第一大部分是類ChatGPT產品,相比ChatGPT有一些微創新,但沒有本質區別。這類產品是一個可以幫人完成工作的助理,類似於Siri的升級版本,沿襲了當年人們對智能助手的想象。
這些產品之間拉不開差距,且用戶羣體不明確,很多用戶體驗以後因爲沒有需求就不再用了,所以產品面臨互相卷價格的問題。
第二大類是利用某個垂直技術,做垂直的事情,服務於一批特定的人羣,以取得收益。但天然會面臨的問題是,同行會用免費來卷,使得商業模式不成立。
還有一大類是,國內的築夢島、Glow、星野、彩雲小夢等,這一波基本做的是網文角色扮演。你是一個愛幻想的少男少女,喜歡看網文、追劇,你創造了一個角色,很期待跟他交流。這種產品更多時候是自己用。
這個用戶羣體加起來700萬左右,大概就是以前小冰的虛擬男女友的用戶羣體。但它沒有商業模式。
小冰做的產品,和現在國內很多人關心的產品不一樣。小冰的X Eva做的是C2C平臺。任何一個克隆人都有模板,你可以去拍同款,也可以自己克隆一個。
這個克隆人可以早上打電話叫你起牀,晚上給你打着電話睡覺。他會生產各種內容,會唱歌,會說英文。
我們認爲,通過廣告和電商把免費的模式進行轉化,這樣的模式不適合AI。每一個人工智能時代的用戶都是付費用戶。
小冰的商業模式這些年沒變過,就是“創造人,買賣人”。所以小冰的平臺上沒有免費的克隆人,都是付費的,而且我們的利潤率很高。我們很可能是目前爲止AI C2C平臺最賺錢的產品。
其實可以把它的模式理解爲淘寶。淘寶上有很多小店店主,他們在淘寶上賣東西,淘寶幫助小店店主賣好東西,讓用戶能買到他們喜歡的東西。
問:造克隆人,最關鍵的是什麼?
李笛:克隆人最重要的是情感紐帶,而解決情感紐帶跟技術本身的關係不大。造人,纔是目的。
爲什麼這麼說?我舉個例子,女生小時候的布娃娃能互動嗎?有聲線嗎?都沒有,但捨不得扔,有心事的時候還會對它傾訴,布娃娃髒了破了願意花幾千塊錢找人修復。智能音箱功能很多,但稍微舊一點就不要了。
這兩者的區別是科技嗎?不是,是人的情感投射。
我們在日本有一個項目就是這樣。我們給日本30萬老年人做家庭智能助理,老年人根據自己的想象用AI創造出一個他想要的人,大部分會創造出他的孫子、兒時的玩伴、逝去的親人等等,老年人可以跟AI交流,可以得到政府提供的公共衛生服務。這樣的克隆人,存在的時長就會大大增加。
不過,大模型讓我們做這件事情更方便了,效能提高了。原來創作一個性格,要花大概6個月,在知識圖譜上,在基本語料庫上做大量分析。現在可以簡化成,一個很好的預訓練的模型,加上向量數據庫,週期從6個月縮短到1天,效果比原來還好。
一個有情感的聲線,原來需要錄2萬個小時,現在我們可以用一句話、1分鐘,如果是錄5分鐘,還能讓它唱歌。
但是你拿它幹什麼,還是最關鍵的。
我們從2016年開始用AIGC創作,如果只是做內容,往外傾銷,就很便宜。如果把創造能力,把性格、才藝賦予到克隆人身上,克隆人就會更有價值。人們會更容易喜愛它,更容易跟它建立長期關係。我認爲,長期關係是這個社會最重要的事情。
那長期關係怎麼定義?不是DAU,不是我佔了你多少個小時,至少不能只以這個維度來判斷。
我每天交流最多的是我的同事,而我最好的朋友可能一個月甚至兩個月才聊一次,但是他說什麼話我都聽,這纔是長期關係。
長期關係是慢的。所以我們追求的,不是人工智能能黏住用戶。如果是這樣,那太貴了。因爲你每次來找克隆人,平臺都在給你掏錢,所以我希望你在關鍵的時候來找克隆人。
問:克隆人C2C平臺上排名靠前的需求是什麼類型的?
李笛:我們這個平臺上,50萬粉絲的網紅有1500多個,百萬粉絲以上的接近1000個。
其實用戶希望得到的是克隆人本人的內容,希望獲得TA唱的歌,對TA情感傾訴,和TA有交流陪伴。
這些主播、網紅也有私域的服務,只不過他們服務不過來,也有可能做得不好。小冰平臺現在能美化TA。
小冰平臺和初期的抖音平臺有一個共同點,大部分是顏值類網紅。但一個很大的區別是,抖音上大部分的網紅英文不行,我們平臺上所有網紅,如果你跟TA打視頻電話的時候說英文,TA會用英文交流。我們還怕英文過於標準,顯得不太真實,專門調成了“Chinese-English”。
用戶還喜歡問網紅一些特別奇特的問題,比如圓周率、勾股定理,我們的網紅克隆人,人均“量子糾纏”都能解釋得非常清楚。總得來說,我們希望克隆人比本人要好,能拓展更多能力。
問:這是一個跟粉絲溝通的工具,有沒有計劃做明星克隆人?
李笛:對,我們認爲這是一個新的平行世界的私域。但爲什麼不做明星?一是明星容易塌房,第二,坦率地講,明星市場沒有想象中那麼廣闊,第三,我們做過明星,明星都要求自己跟其他的明星不同,所以很難實現標準化。而創造克隆人這種新事物,一開始最需要的就是標準化。
問:C2C模式怎麼避免擦邊甚至違規內容的出現?
李笛:這涉及到兩件事。一件事是,要想避免公序良俗或者法律意義上的違規,是容易的。但另外一件事,我們到今天爲止也沒想明白。
假設你希望這個AI是你的女朋友,那在你們一對一的私密對話過程中,克隆人應該用什麼尺度?我們應該怎麼把握人和人工智能的尺度,今天行業裡沒有答案,這是個社會層面的問題。
問:怎麼規避網紅收割粉絲的風險?
李笛:有的是新問題,有的是老問題。對於老問題,我們優選的方案是監管、排查、制定規則、執行規則,只不過以前只能靠人看,現在可以用機器、用新的技術方法來執行。
當然,我們也可以讓克隆人執行規則,可能比一味地靠監管去執行更好,那麼,就可能變成新問題。
也許,不是網紅想“收割”,是機構甚至是平臺在收割粉絲。也就是說,網紅也得能監督TA的克隆人。所以我們會把克隆人的行爲報告給本人,讓本人監督。
而且,嚴格意義上小冰平臺不是社交網絡,因爲你不可能碰見真人,我們嚴格禁止人和人相遇。
問:跟本站雲音樂合作的X Studio,能比人類歌手創造出更驚豔的作品嗎?
李笛:唱作作品分爲詞曲、編曲、演唱。很多公司在做詞曲、創作。中國聯通彩鈴業務是我們生成的,已經做了好幾年,詞曲雖然很重要,但只有它不值錢,演唱部分是很關鍵的,這是一個很大的市場。
人們在討論內容作品比如寫詩或者作畫的時候,往往會混淆一個概念,它是藝術作品還是內容消費品?
藝術品的評價標準永遠在人的手裡,而內容消費品可以發揮AI穩定性、高併發的優勢。所以我們不是在創造一個經久流傳的人工智能歌手,是在創造一批一批比人更穩定的歌手,讓原本複雜的創作過程變得簡單。
問:AI數字員工業務現在進展如何?to B的生意是不是相對難做?
李笛:目前爲止,只要企業做競標、招投標,我們數字員工的中標率是80%。幾大央企、招商局集團的數字員工項目都是我們做的。
在大模型之前,數字員工更多是承擔前端的交互,是企業形象代言人,可以生產短視頻,也可以是銷售。
有了大模型以後,數字員工可以承擔一些新的崗位,比如後端輔助側,企業內部的協同側。
B端和C端生意各有各的難。如果從興趣角度出發,我更喜歡做to C的事情,而不是做to B的生意。
03
從微軟分拆後,沒人給趟坑了
問:現在小冰團隊有多少人?小冰X Eva、歌手克隆人和數字員工三個業務的人員投入比例是怎樣的?
李笛:我們中國團隊有360多人,日本團隊有70人。
最大的投入還是框架。小冰最引以爲傲的是不僅限於大模型、不僅限於技術創新的一個1000多個Service構成的完整的框架。我們這麼多年做的就是這個,所以人員最多。
這本質上是一個通用的框架,既驅動B端的數字員工,也驅動C端的網紅克隆人、歌手克隆人。所以,在我們平臺上,一個克隆人掌握着另外一個領域看起來截然不同的能力。比如,數字員工也能唱歌。
再往上,B端的工作,交付環節肯定得有技術人員、銷售人員。C端也需要人員做產品創新。
問:2024年,從收入的角度,你對哪個業務的增長預期更高?
李笛:我們分別給B端和C端,定了一個差不多的業績增長目標。哪端能做大都很重要。但是你要問我個人更希望哪個做大,是C端。
因爲我認爲人工智能發展到這個階段,就算一個B端的生意,本質上也要和C端打交道。所以我認爲做C端的事情更重要。
問:分拆後,你的工作方式、思維習慣發生了哪些大的變化?
李笛:我們是在2020年7月份宣佈分拆、同年9月份完成分拆。但坦率地講,在過去這幾年,我們最大的體會實際上是疫情前後的變化,不是分拆前後的變化。
從主觀的角度來講,我個人認爲分拆之後,在得的方面是,我們不用再擔心小冰給微軟惹禍了。
但也有壞處。人工智能很重要的事情在於趟坑。原來我們在微軟的時候有一個特別大的好處是,我們趟的坑多。任何一個在人工智能領域出現的坑,微軟都有團隊趟過。小冰知道哪些地方有坑、有雷,這很關鍵。但分拆以後,畢竟我們是個獨立的公司,知道地雷這種事,比原來少太多了。
問:現在你焦慮的點是什麼?
李笛:AI類型的產品很容易作廢。我是產品經理,最主要的任務是做產品。所以我自己最焦慮的是,沒有把時間花在做產品上。現在我就挺焦慮的,等會咱們對話結束,我一去幹產品,就不焦慮了。
問:除了你們探索的方向,你認爲行業裡其他方向還有沒有機會?
李笛:多模態的大模型,需要去追求它已經探明的技術創新,進行落地之外,我個人認爲,很多人低估了Diffusion Model(擴散模型)現實存在的巨大價值。
今年如果有其他領域或者同行業的創新,很可能出現在Stable Diffusion這邊,而不是大語言模型。
問:具體來說有什麼機會?
李笛:比方說,基於人工智能的,特別是視覺化的生成,所對應到的一些協同。
我個人認爲它甚至會顛覆掉一大批老牌工具。另外它還有可能直接顛覆到端的,從內容生成、投放,到用戶隨需定製的整套系統。
當然,我們仍然期待,最後出來的GPT-5是不一樣的。市場總有一些東西比你想象得要好。不過,如果它發生了,其實對落地不是好消息,因爲大家又會繼續去憧憬夢想,不落地了。
編輯 / 金璵璠