誰在中國“圍獵”AIGC?
作者|閆妍
編輯|章劍鋒
出品|本站科技《後廠村7號》欄目(ID: tech_163)
爲什麼中國沒有出現ChatGPT?我們的差距在哪裡?要投入多少資金才能與之抗衡?
“本質是專注和決心,是有沒有做到AI First。”小冰CEO李笛直言,從技術層面來講,大模型的技術沒有太多的秘密,中國人的技術不亞於歐美。在本土化實踐技術、中文大模型等方面,中國甚至某些方面領先。
“AIGC背後的大模型是大資本的遊戲,長期持續投入真的很貴。”資深人工智能研究專家田濤源告訴《後廠村7號》,在ChatGPT出現之前,較多企業不會選擇把錢燒在一個未知的機會上。“GPT3.5訓練一次需要花費300-460萬美金,還只是算力的成本,沒算人才的成本,Open AI一共375人左右,一年工資開支就要2億美金,AI算力開支5億美元,需要雄厚的資本支撐。”
但ChatGPT的驚豔四座,AIGC的技術質變,投射到廣闊的中國互聯網上,引燃了AI從業者的光榮與夢想、激情與野望,在噴薄、在躍動。
AI創業者陳東記得,臨近過年的寒夜,在北京的朋友家裡,他們吃着開心果、瓜子,徹夜交流,一晚上的話題幾乎都與AIGC和ChatGPT有關,雖然不少人對此還是半懂不懂,卻富有熱情。
一位投資人告訴記者,去年受大環境影響,大多AI創業團隊生存堪憂,年底負責AI賽道的投資小組還在爲如何向LP彙報苦惱。三個月而已,AIGC已成爲2023年最火爆的投資賽道,沒有之一。當下這份帶有傳染性的熱鬧氣氛,讓他一掃2022年的垂頭喪氣。
在被ChatGPT驚豔的同時,國內業界也在思考:AIGC的商業模式是什麼?哪些方向存在更多機會?中國版ChatGPT的危與機?
最重要的是,哪些企業憑着自己的敏銳嗅覺和拼闖勁頭,抓住這波技術紅利,尋求命運的蛻變,能夠脫穎而出引領下一個時代?
(圖爲張頎AI繪畫作品,由受訪者供圖)
中國AIGC生態初現:大廠搞基建,小廠做創新
當下,全世界互聯網都颳起了一陣ChatGPT風。這款由OpenAI推出的全新聊天機器人模型,不僅可以回答人類的提問,承認自己的錯誤,還能作詩、編程甚至幫助大學生完成論文。它讓馬斯克感嘆“好得嚇人”,也代表AIGC向全世界喊出了“芝麻開門”。
在中國,圍繞AIGC生長出的市場生態,已嶄露頭角。
“AIGC並不是一個多麼新鮮的概念。”陳東談到,大廠很多2C應用裡,已經有不少內容是AI生成的,甚至出現過廣告對外宣傳已經在大規模使用AIGC技術,至少兩年前就有這個方向的創業團隊出現,並得到了一線美元基金的青睞和投資。
在他看來,AIGC不只是大廠的機會,也將新起很多創業公司。一類公司偏底層,在新場景中孕育大模型的突破,產研類似DALL·E、GPT等產生很多新模型;另外是在應用層中,也會出現很多新公司,包括生成文字、圖像、視頻、數字人等等。
在趕超ChatGPT的巨大誘惑下,大廠率先打響了追平基礎大模型差距的“攻堅戰”。
2月7日,經百度確認,百度類ChatGPT項目名字確定爲“文心一言”,英文名ERNIE Bot,預計3月份完成內測,面向公衆開放。除百度外,還有騰訊、阿里巴巴、快手、字節跳動、京東、本站、360、商湯、美圖等大廠都在AIGC領域有所投入,加入到這場全球新一輪AIGC技術競賽。
“好的人工智能大模型是非常費錢的。”在資深人工智能研究專家田濤源看來,這股預訓練大模型的風潮之下,其實是一場拼數據、拼算力、拼財力的軍備競賽長跑。
他介紹,基礎模型GPT3.5訓練一次需要花費300-460萬美金,還只是算力的成本,沒算人才的成本,Open AI一共375人左右,一年工資開支就要2億美金,算力開支5億美元。“這真是很貴,而且前面那麼多年是沒商業回報的,基礎模型的參數又是持續優化的過程,隨着商業化進展加速要不斷進行訓練,需要雄厚的資本支撐,確實是小公司用不起來。”
但對於基礎大模型、應用大模型未來的商業價值,行業從業者都有共識、有期待。
“AIGC生態最值得關注的就是大模型的建設能力,這將成爲AIGC長期價值的重要增長點。”AI創業者“web3天空之城城主”激動地說,“這是用短期的投入換10年後千倍收益的事情。”
另一面,在細分行業中,AIGC的造富速度同樣讓人們睜大眼睛。
去年10月19日,以文字生成爲主的AIGC項目Jasper.Ai完成了1.25億美元的A輪融資。完成融資後,憑藉15億美元的估值躋身AIGC賽道獨角獸俱樂部。就在Jasper.Ai宣佈融資的前一天,Stability AI成功融得資金1.01億美元,投後估值達10億美元。
在AIGC的垂直技術場景中,按照模態區分,可以分爲音頻生成、文本生成、圖像生成、視頻生成等細分領域,均已出現中國企業的探索身影。
文字生成:小冰、Glow、清華九歌、彩雲小夢、寫作貓、瀾舟科技、元語智能等。
圖像生成:百度文心一格、盜夢師、TIAMAT、達利AI、6pen、圖宇宙、Artflow等。
視頻生成:抖音的剪映、快手的雲剪、影譜科技、藍標分身、商湯智影、詩云科技的Movio等。
音頻生成:本站天音、StarX MusicX Lab、DeepMusic等。
Game AI:rct.Ai、本站伏羲等。
數字人:啓元世界、倒映有聲等。
(本站科技梳理)
2023年1月,啓元世界戰略總監王思捷接到了數通來自投資圈和產業圈朋友的電話。兩年前,他所在的公司開始大力投入數字人和game AI的產研,朋友們大多在問,行業環境怎麼樣,變現能力如何。掛斷後,王思捷意識到有人大概會有下一步動作,“感覺已經動心了。”
從獨角獸到大廠,從使用者到投資人,從業界到學術界,AIGC在應用層的創新引發了廣泛的關注。
有數據顯示,在用戶增長數據方面,TIAMAT內測的用戶爲2萬人,盜夢師日增5萬,上線兩個月已積累50萬用戶。詩云科技合夥人樑望也向記者透露,旗下視頻生成產品Movio上線不到一年時間,已在海外市場獲得了不錯的用戶增長數字。
資本涌入、互聯網巨頭紛紛佈局的背後是AIGC巨大的經濟價值和市場規模。
Gartner預測稱,到2026年,全球30%的企業機構將擁有用於數字人和元宇宙的產品與服務。麥肯錫則預測,到2030年全球元宇宙相關支出或達5萬億美元。更值得期待是,AIGC正在逐步探索性地進入真實工業生產鏈條,應用到營銷、遊戲、代碼、生命科學等多個領域。
尤其是一級市場,投資人的脈搏正在變快。
明勢資本合夥人夏令直言,2021年年底他就和同事在梳理AIGC領域的機會,並且做了投資佈局。AIGC讓他感到興奮的有三點:一是,用戶在環、端到端數據驅動模型的上限極高,模型迭代+高質量反饋能帶來持續效果提升;二是,以抖音、小紅書爲代表的內容製作再分發的邏輯有可能變爲用戶與AI系統共同創造個性化內容的邏輯;三是,新一代的AI技術範式將有機會讓人類腦力勞動真正商品化。
“下一個時代已經開始。”
去年底,知春資本董事總經理謝夢暉就觀察到了這波創業的列車再一次提速。一個側面反映,“我們之前投資的相關領域被投企業,尤其是基於ChatGPT模型進行商業化衍生的公司,開始頻繁受邀參加各種技術和投資論壇。”
令他感到驚喜的是,這輪技術的迭代將推動創造商業的新增量。“在新的生產力基礎上,現有的生產關係必然重構,對應的經濟體系、組織模式必然會發生變革,創造力的估值將會呈指數級提升。”
AIGC的商業模式是什麼?
生於1988年的創業者陳東意識到自己正身處歷史之中,連續許多天大廠宣佈入局chatGPT的消息席捲着他的注意力,創業者的朋友圈就像創投世界的溫度計,“之前搞元宇宙、web3甚至NFT的都要搞AIGC”。他和朋友們感嘆太瘋狂了,“像王慧文這種大佬,在朋友圈發佈人工智能入局宣言,說5000萬美元,帶資入組,不在意崗位、薪資和title,求組隊。”
雖然陳東目前還沒找到明確的方向,但已經和投資人喝上了咖啡,“他們其實也想更瞭解這個行業,尤其是如何商業化。”
自AI繪畫工具StableDiffusion開源以來,國內大量主打AI繪畫的網站和APP如雨後春筍般涌來。AI畫師張頎作爲AI繪畫工具重度使用者,一些平臺內測階段就會主動找上門,讓他提看法,找bug。“有的甚至前端的開發人員直接過來問,要如何調整才能提升大家的付費意願?”
(圖爲張頎AI繪畫作品,由受訪者供圖)
產業圈和投資圈對於AIGC,仍有一串真正嚴肅、令人如鯁在喉的問題:AIGC的商業模式是什麼?在中國像open AI這樣的公司在哪裡?如何做成一個產品,既要普惠化,又要足夠深,足夠廣?
借鑑美國的商業化經驗,夏令大致將AIGC領域分爲三類商業模式:一類是OpenAI這種專注於做大模型的公司,提供API,做細分場景應用的公司需要去調用它的API,按API去付費;第二類公司是既做大模型,又直接做垂直一體化應用的公司,比如在AI生成圖像很火的公司 Midjourney,第三類公司是調用第一類公司的大模型API,基於對細分場景的深刻理解,重點開發具體場景的AI應用,比如Jasper這樣的公司。
但對於像OpenAI這種提供API的商業模式,在中國能否真正work,還是個問號。
田濤源講,這個方向不僅在研發階段要承擔巨大的人力成本、算力開支壓力,即便真的推出效果類似ChatGPT的大模型,數據成本、算法調優、AI倫理優化依然居高不下。“目前ChatGPT每回答一個問題,成本至少要一美分,以這樣的方式去做商業變現,面臨着高昂的成本、海量的行業優化需求、多條科技戰略路徑決策選擇。”
同時,ChatGPT類似第一代iPhone,上面尚沒有成功的爆款APP(例如憤怒的小鳥),它離穩定性的商業服務還存在距離,沒有跨過工業紅線。在他看來,當下還處於從實驗室基礎技術轉向產業界爆款應用服務的過程中,處於很早期。“但至少讓大家看到了基礎模型巨大的跨領域服務能力,找到了通用人工智能的一條可能成功的路。”
與此同時,在國內真正能做AI大模型的公司其實是極少的。
夏令觀察,但凡能做底層的模型,不管是去做語言大模型的,還是去做強化學習的,只要以技術見長,以工程化產品化的思維做底層模型的公司,融資都非常不錯,過去一兩年VC都要搶着投進去。“可能資本的溢價沒有像美國那麼誇張,但一兩年時間做到10億美金估值的公司還是有一些的。”
有投資人向記者證實,目前很多創業者正在入局垂直場景,解決細分的需求,尤其是遊戲AI和數字人生成這兩條綜合性的AIGC場景,已經出現趨於成熟的商業化範式。
王思捷和啓元世界團隊此刻正在經歷創業以來最繁忙的日子:由於入局較早,從算法到工程整個一套的體系積累下來的能力,已經自建出百億參數的game AI和數字人AI垂類大模型。風口降臨後,有頂級遊戲製作人已經主動上門尋求合作。
他引以爲傲的是,這套垂類模型的訓練和推理成本可以做到比Open AI同參數規模的模型低一個量級。在王思捷看來,先構建更小的垂類模型(比如百億參數、十億參數),讓數據飛輪和模型訓練能夠很好結合,垂類模型在某些領域可能比open AI的效果更好成本更低。“這種想象能力是在中國更能跑通的。”
小冰CEO李笛則直言AIGC商業回報賽道最大的是數字人,“它的客單價明顯會更高,我們做過終端內容的生成,感覺這是個菜市場般的內容市場,單價非常低,直到我們將AI生成能力捆綁到數字人身上,平均客單價迅速從20萬提高到了300萬,當然你的成品質量要足夠高。”
但對於只懂用API調用生成內容的創業團隊,參與本次採訪的受訪者大多表示,“價值有限。”
李笛試圖放出一個警惕信號,奉勸想要進入AIGC賽道的創業者,要謹慎使用大廠提供的可調用接口,儘可能自建垂類模型。
“API調用的商業模式掙不到錢,所以即便是爲了發展,大廠也一定會跳進去,去做生態鏈上面其他生態類企業的事情,首當其衝就是直截了當應用他們的技術來提供服務的人。”他判斷最終的結果,“你要做起來一定會被吃掉,骨頭都不剩。”
中美差距:不在技術,在專注
在被ChatGPT驚豔的同時,國內業界也在反思:爲什麼中國沒有出現ChatGPT?
事實上,此前不乏有國內公司雄心勃勃想登上中文版ChatGPT的“王座”。但在可能的未來和確鑿的現實面前,在鉅額投入和業績報表的衝突面前,選擇了猶豫不前。
“大模型的技術沒有太多的秘密。”李笛直言,在ChatGPT出現前,小冰從2017年就開始做AIGC相關的東西,從技術層面來講,中國人的技術不亞於歐美。在本土化實踐技術、中文大模型等方面,中國甚至某些方面領先。
文心一格相關負責人也告訴記者,和海外的同類型產品相比,在跨模態生成能力、中文知識與理解,以及繪圖效率等方面,其實公司在技術層面均存在着優勢。他舉例,“中文知識與理解方面,文心一格對中文文本、文化和風格就能有更好的理解與刻畫能力。”
事實上,國內,一羣最勇敢、懷抱最狂野夢想的年輕創業者,已經帶着自己的AI生成產品挑戰海外市場,與世界一流的上市公司對標產品能力。
“我們現在主要的產品叫 Movio,是一款 AI 視頻創作工具,主要面向全球市場,從歐美出發。”詩云科技合夥人樑望向記者介紹選擇出海的原因,“一是歐美地區對於 SaaS 的接受度、付費意願和市場體量高很多,二是他們的期待和標準也會高很多,就像參與 SaaS 領域世界上最頂級的賽事,我們有意選擇最高標準的市場,接受最嚴格的用戶的眼光,以此證明中國團隊也能做出全球領先的 SaaS 產品。”
“AIGC 這件事要真正落地,門檻不僅僅是技術水平,更重要的是從 AI 到用戶到數據,再到產品體驗能夠循環起來的一個飛輪。”從目前拿到手的海外用戶反饋,他判斷,“在這個方向上,我們現在技術和產品體驗上,都是比較領先的。
對比海內外的團隊,樑望最大的感受是大家對於創新的理解和投入度存在差異。例如,面對那些可能短期甚至中期內都看不到回報的創新,團隊是否仍然擁有無論如何都要去做出來的精神和決心。
作爲企業的一把手,李笛也深刻認知到中國和北美的商業和科技環境的不一樣,國內大多企業沒有那麼多的錢會燒在一個未知的預測上。“要花很多的錢,要花很多時間,短期內難有商業價值,誰也不知道這個是不是可行。”
“本質是專注和決心,是有沒有做到AI First。”李笛直言,好幾年前看到Open AI,他們做到了全情投入,這也是唯一的不同,Open AI花了足夠的時間和精力在賭,敢於相信一個暴力出奇跡的大模型,但他們那個賭小冰確實不敢賭,“創業生死一線間,某種意義上,如果Open AI不推出Chat GPT,他們今天可能很堪憂了。”
田濤源看來,這件事給大家一個啓發:我們對人工智能硬件(例如芯片)非常重視,但是人工智能的基礎軟件(例如大模型、訓練框架、大數據工具鏈),是不是長期投入不足、沒有足夠重視?有沒有決心進行長期的基礎研發投入?
中國投資與產業界更在乎短期商業回報上的表現,即快錢。“在中國是大家看到哪個技術到了商業價值轉化的臨界點,所有人一擁而上,對許多大型科技或實體行業龍頭企業來說,AI基礎科研重視程度不足,缺乏大模型自研能力和戰略定力,大家以快速產出的應用爲導向,而技術算法的研發必須要很長時間的積累。”田濤源講。
但一些極擅長工程化的中國AI公司入場,也必將攪動全球AIGC市場。
夏令講中國優秀的AI初創公司擁有非常明確的一點優勢,就是具備很強的工程化能力,搭建一個相比openAI成本更低、迭代效率更高、更滿足明確優化目標要求的模型是可以實現的。
同時,中國整個應用場景具備足夠的豐富性。“我們這麼大的人口基數,產業數字化基礎也已經初步具備,中國在高質量反饋數量上有優勢,而這對新一代AI模型格外重要。我們看重的AIGC公司要有比較好的工程化能力,對中國實際的商業場景有自己獨到認知,我們認爲只有這樣的公司最有機會能夠跑出來。”夏令講。
中國版ChatGPT的危與機
隨着ChatGPT爆火,這一舊金山誕生的技術引爆了全球人工智能產業,AI 公司近乎全面入局,經濟鏈條的最上游資本市場也出現了震盪,預示變革的信號彈一枚接一枚地炸響。
(圖爲張頎AI繪畫作品,由受訪者供圖)
“中國一定要有自己的GPT-4,即基礎模型(大模型)。”
田濤源強調,“中國的科技創業團隊應有危機感。”ChatGPT也好,基礎模型也好,越多的開發者、越多樣化的高質量數據、使用場景,對基礎模型的反饋和優化就是越有價值。“誰先去做強化學習,誰就具備先發優勢,這對於我們是一個很大動力和壓力。”
藍馳創投肯定地告訴記者,內容本身是非常區域化、地緣化的,也和用戶數據息息相關,所以更高規格的AIGC,應該要對當地的文化有深度理解,本身中國市場足夠大,相信針對中國市場通過AI生產內容,將有巨大的機會。
而在機會的另一面,是所有ChatGPT面臨的最大門檻——“安全和合規”。
2016年,微軟就做出了聊天機器人,可以實時地通過用戶反饋,並修改自己的回答,但一經發布後,24小時就被教成了種族主義者,很快就被下架了。“我們的實驗室也有自己的對話機器人,過去這個是不敢放出來的。”一位頭部AI公司創始人告訴《後廠村7號》欄目。
談到具體落地,資深人工智能研究者田濤源提出:“OpenAI官方在2020年7月發佈的《Language Models are Few-Shot Learners》報告中對提出了ChatGPT背後語言大模型的能力邊界與挑戰提醒:
1、表達問題:語義重複,長篇幅段落中失去連貫性、自相矛盾,偶爾不符合邏輯
2、缺少物理常識:GPT-3很難回答“如果我把奶酪放進冰箱,它會融化嗎?”
3、訓練效率差與世界模型:GPT-3與人類語言訓練效率存在顯著差距,但GPT-3在預訓練期間學習的文本規模遠大於人類一生中看到的文本,以物理世界中額外信息爲基礎、算法改進都可能提升效率。
4、不確定性:GPT-3的少樣本學習存在不確定性、模糊性,未來在準確理解少樣本學習原理的基礎上,能在模型推理時“真正從頭開始”學習新任務。(不清楚人類“從零學習”是否會受以往知識的影響)
5、大模型適用性不好:不方便進行推理,實用性不好,大模型蒸餾到可管理的大小,GPT-3等大模型包含廣泛的技能,但在特定任務中並不需要,原則上激進的蒸餾“瘦身”是可能的方法,但在對千億參數的大模型上還沒有過嘗試,可能會遇到“決策不易解釋”、 “輸入的預測不易校準”、 “訓練數據的偏差”(數據偏見帶來模型偏見,社會倫理影響)。”
“我看到像Open AI的負責人現在也跳出來,主動地說希望被監管。”
在上述AI頭部企業創始人看來,這種大模型的最終落地,必然要接受非常嚴格監管。“如果放任發展,過十年它能讓美國那一代學生的教育水平大幅度下滑。”
在他看來,ChatGPT真正在C端出圈,離不開想要藉此抄作業的學生,背後涉及的是AI倫理問題。“在美國,10個學生有9個過去幾個月迅速知道了ChatGPT,並通過它寫作業上交,這是它會火爆的一個重要的推手,它解決了實際問題,但是這個解決問題的方法是不正確的。”
他對資本市場所謂的天氣預報不感興趣。這段時間,不乏有投資人找過來,提議去做ChatGPT類似的大模型,但他沒有接受這根橄欖枝。“不是特別愛搶這種風頭,我是不會推出一個讓學生抄作業的東西,不管賺再多的錢。”
他希望,選擇去做ChatGPT類似應用的同行,能夠更多考慮AI倫理的自律問題,提前預估學生拿到它會做什麼?被迅速鋪開怎麼辦?“盡力做好安全和合規吧,讓它last for long,能夠持續的存在。”
談到安全和合規問題,百度文心一格相關負責人向記者表示,希望可以釐清各方合規權責,兼顧內容安全和業務創新發展,建議基於不同的細分應用場景和產品模式特點,分類分級制定可落地規則,未來可以鼓勵行業領先企業主動分享創新合規實踐經驗,推動形成行業標準,打造可借鑑的產業合規實踐方案。
業內有共識,對於ChatGPT的討論,未來幾年都不會停歇。
但明確的是,ChatGPT以及其對應的大模型發展,就是未來的一個技術革命,可能還沒有到達大家想象的那種令人恐慌的程度,但確實會讓未來幾年的創新得以釋放。
在田濤源看來,大家現在執着於去搞ChatGPT,放眼整個人工智能未來,只是其向前邁進的一塊墊腳石。“再往上走,還有更多巨大的機會。”
在他的想像中,AI可以推動人類對航天的探索、對新能源的探索、對新材料的重大發現,隨着它對物理規律認識的越透徹,對人、對環境、對生命體的認知越來越深刻,能夠逼近一些人類認知範圍以外的未知知識,甚至具備新知的可能性。
在這場或許比移動互聯網更加顛覆的大變革裡,對於中國AI企業,距離終點仍有漫長的道路要尋找、摸索、攀登。
(應受訪者要求AI創業者陳東爲化名)