華爲哈勃,悄悄投了清華兩撥人
文/王碩果編輯/鄢子爲
華爲哈勃低調入股的兩家大模型公司,接連發布新動態。
8月中旬,面壁智能宣佈,旗下大語言模型MiniCPM系列,自2月面世以來,累計下載量已超百萬。
7月底,生數科技面向全球,上線文生視頻大模型Vidu,性能對標Sora。
面壁智能和生數科技,分別成立於2022年、2023年,核心團隊均來自清華大學。面壁智能CEO,爲知乎前CTO李大海;生數科技CEO,是本碩就讀於清華計算機系的唐家渝。
AI賽道火熱,華爲哈勃看好這兩位青年才俊的潛力。
新銳組隊
哈勃投資是華爲全資控股的投資機構。
據企查查,其有兩個主體,分別爲哈勃科技投資有限公司、深圳哈勃科技投資合夥企業。
此前,華爲哈勃的投資,聚焦硬科技方向,入股多家半導體芯片企業,今年接連扶植兩家清華新銳,顯示出對AI賽道的重視。
據IT桔子數據,哈勃今年接連向人工智能領域下注,投資金額累計達1.32億元。
在大模型方向,其偏愛名校精英。
入股的兩家公司,創始團隊結構相似,均背靠清華大學。
生數科技的核心成員來自清華大學人工智能研究院,面壁智能的創始團隊脫胎於該校自然語言處理實驗室(THUNLP)。
一衆清華面孔組成生數科技高層。除CEO外,其首席科學家由清華人工智能研究院副院長朱軍擔任,CTO鮑凡是唐家渝同門師兄、朱軍的課題組成員。
去年6月至8月,生數科技連續完成兩輪融資,累計獲得上億元。今年6月,哈勃斥資入股,參與其A+輪融資。
面壁智能的成長路徑類似。
其聯合創始人劉知遠,是清華大學計算機系博導,研究方向爲計算機自然語言處理;公司CTO曾國洋,今年26歲,是競賽保送生,大二就進入清華自然語言處理實驗室。
據李大海介紹,面壁智能科研團隊共有100多人,清北畢業員工數量佔比高達80%,平均年齡僅爲28歲,在權威期刊會議發表論文百餘篇。
創立面壁智能前,李爲知乎CTO,從零開始爲平臺搭建搜索和推薦業務,發起AI“智能社區”,增加月活躍用戶數。
去年,ChatGPT 火爆,所有人都在談論AGI(人工通用智能),他跟該公司核心成員都聊了一遍。確認AGI是每個人的信仰後,果斷加入。
老東家支持其創業,同年4月,面壁智能獲得知乎數千萬元人民幣的投資。一年後,哈勃入股。
接連推新
兩家創業公司,在較短時間內,均推出了新產品。這是吸引華爲哈勃等機構投資的重要原因。
4月下旬,生數科技聯合清華大學,發佈視頻大模型——Vidu。7月底,Vidu面向全球上線,開放文生視頻、圖生視頻兩大核心功能,提供4秒和8秒兩種時長選擇,分辨率最高達1080P。
Vidu生成一段4秒片段,只需30秒。目前用戶直接使用郵箱註冊,即可上手體驗Vidu。
據介紹,Vidu生成視頻流暢連貫,沒有明顯的插幀現象,且鏡頭語言豐富,可切換遠景、近景、特寫等不同鏡頭。
“Vidu在16秒長期保持和語義理解等方面表現得非常突出。”生數科技首席科學家朱軍評價道。
面壁智能也推新動作不斷。
5月,其大模型Luca面世。李大海表示,Luca的多項語言模型能力與ChatGPT相當。
同月,面壁MiniCPM-V2.0上新,可以精準識別細節紛繁的街景,還能識讀2300多年前的清華簡上的古老字跡。
早在去年,面壁智能就推出了ChatDev智能軟件開發平臺。有製作小遊戲、網站開發、創意設計等需求的用戶,只需要通過ChatDev描述項目名稱和相關想法,便可快速實現。
用李大海的話來說,一位普通用戶“只需要一杯可樂的時間,用不到一美元的成本”,就能做出一個小軟件。
商業化初步落地。面壁智能已攜手招商銀行、數科網維、知乎等,將技術應用於金融、教育、智能終端等場景。
舉個例子,6月底,該公司研發的人工智能輔助審判系統,已在深圳市中級人民法院上線運行,覆蓋立案、閱卷、庭審、文書製作等流程。
自今年1月試運行以來,該系統輔助立案29.1萬件;輔助生成文書初稿1.16萬份。
獨闢蹊徑
李大海與唐家渝,有個相同特質,不迷信前人走過的路。
比如,GPT強調“大力出奇跡”,而面壁團隊的做法,是通過小模型預測大模型性能:先在參數量爲0.009B到0.03B的模型上做訓練,再外插到2.4B的模型上預測性能,最後,訓練2.4B的模型。
這一方法事半功倍,先在小模型上做實驗、調參數,可以降低訓練成本。
公司成立之前,作爲北京智源人工智能研究院“悟道”項目的成員,面壁團隊從2020年就開始訓練語言大模型。
過往經驗,讓他們知道大模型需要什麼樣的數據。
“大家很容易陷入一個誤區,過度關注數據的絕對量。其實,數據的質量,如何利用數據,以及對數據的認知纔是更重要的事。”曾國洋稱。
因資源受限,團隊很早就使用分佈式加速、參數微調等方法,降低成本。2022年,面壁團隊參數微調的工作,還發表在Nature子刊上。
生數科技的打法類似。
技術路線上,生數採用的是和Sora一樣的融合架構,但在產品路徑上,兩者不同。
Sora團隊選擇all in長視頻,其背後有Open AI的技術實力,以及微軟的算力支持。初創公司生數科技的條件,無法與之媲美。
唐家渝團隊選擇從2D圖像開始,再拓展到3D和視頻領域。
視頻本質上是圖像在時間序列上的擴增,可以看成連續多幀的圖像,在圖像上的工程化工作,比如數據的收集、清洗、標註以及模型的高效訓練等經驗,是可以複用的。
整個2023年,生數主要資源都放在了圖像和3D上。到今年1月,才上線4秒短視頻生成。2月,Sora發佈之後,該公司進展加速,4月可生成16秒短視頻。
大模型賽道,國內外各團隊競相“秀肌肉”。這兩支清華系團隊,剛開始熱身,期待跑出不俗的成績。
屆時,入股早的華爲哈勃,有望獲得超額收益。