☰

華爲哈勃，悄悄投了清華兩撥人

文/王碩果編輯/鄢子爲

華爲哈勃低調入股的兩家大模型公司，接連發布新動態。

8月中旬，面壁智能宣佈，旗下大語言模型MiniCPM系列，自2月面世以來，累計下載量已超百萬。

7月底，生數科技面向全球，上線文生視頻大模型Vidu，性能對標Sora。

面壁智能和生數科技，分別成立於2022年、2023年，核心團隊均來自清華大學。面壁智能CEO，爲知乎前CTO李大海；生數科技CEO，是本碩就讀於清華計算機系的唐家渝。

AI賽道火熱，華爲哈勃看好這兩位青年才俊的潛力。

新銳組隊

哈勃投資是華爲全資控股的投資機構。

據企查查，其有兩個主體，分別爲哈勃科技投資有限公司、深圳哈勃科技投資合夥企業。

此前，華爲哈勃的投資，聚焦硬科技方向，入股多家半導體芯片企業，今年接連扶植兩家清華新銳，顯示出對AI賽道的重視。

據IT桔子數據，哈勃今年接連向人工智能領域下注，投資金額累計達1.32億元。

在大模型方向，其偏愛名校精英。

入股的兩家公司，創始團隊結構相似，均背靠清華大學。

生數科技的核心成員來自清華大學人工智能研究院，面壁智能的創始團隊脫胎於該校自然語言處理實驗室（THUNLP）。

一衆清華面孔組成生數科技高層。除CEO外，其首席科學家由清華人工智能研究院副院長朱軍擔任，CTO鮑凡是唐家渝同門師兄、朱軍的課題組成員。

去年6月至8月，生數科技連續完成兩輪融資，累計獲得上億元。今年6月，哈勃斥資入股，參與其A+輪融資。

面壁智能的成長路徑類似。

其聯合創始人劉知遠，是清華大學計算機系博導，研究方向爲計算機自然語言處理；公司CTO曾國洋，今年26歲，是競賽保送生，大二就進入清華自然語言處理實驗室。

據李大海介紹，面壁智能科研團隊共有100多人，清北畢業員工數量佔比高達80%，平均年齡僅爲28歲，在權威期刊會議發表論文百餘篇。

創立面壁智能前，李爲知乎CTO，從零開始爲平臺搭建搜索和推薦業務，發起AI“智能社區”，增加月活躍用戶數。

去年，ChatGPT 火爆，所有人都在談論AGI（人工通用智能），他跟該公司核心成員都聊了一遍。確認AGI是每個人的信仰後，果斷加入。

老東家支持其創業，同年4月，面壁智能獲得知乎數千萬元人民幣的投資。一年後，哈勃入股。

接連推新

兩家創業公司，在較短時間內，均推出了新產品。這是吸引華爲哈勃等機構投資的重要原因。

4月下旬，生數科技聯合清華大學，發佈視頻大模型——Vidu。7月底，Vidu面向全球上線，開放文生視頻、圖生視頻兩大核心功能，提供4秒和8秒兩種時長選擇，分辨率最高達1080P。

Vidu生成一段4秒片段，只需30秒。目前用戶直接使用郵箱註冊，即可上手體驗Vidu。

據介紹，Vidu生成視頻流暢連貫，沒有明顯的插幀現象，且鏡頭語言豐富，可切換遠景、近景、特寫等不同鏡頭。

“Vidu在16秒長期保持和語義理解等方面表現得非常突出。”生數科技首席科學家朱軍評價道。

面壁智能也推新動作不斷。

5月，其大模型Luca面世。李大海表示，Luca的多項語言模型能力與ChatGPT相當。

同月，面壁MiniCPM-V2.0上新，可以精準識別細節紛繁的街景，還能識讀2300多年前的清華簡上的古老字跡。

早在去年，面壁智能就推出了ChatDev智能軟件開發平臺。有製作小遊戲、網站開發、創意設計等需求的用戶，只需要通過ChatDev描述項目名稱和相關想法，便可快速實現。

用李大海的話來說，一位普通用戶“只需要一杯可樂的時間，用不到一美元的成本”，就能做出一個小軟件。

商業化初步落地。面壁智能已攜手招商銀行、數科網維、知乎等，將技術應用於金融、教育、智能終端等場景。

舉個例子，6月底，該公司研發的人工智能輔助審判系統，已在深圳市中級人民法院上線運行，覆蓋立案、閱卷、庭審、文書製作等流程。

自今年1月試運行以來，該系統輔助立案29.1萬件；輔助生成文書初稿1.16萬份。

獨闢蹊徑

李大海與唐家渝，有個相同特質，不迷信前人走過的路。

比如，GPT強調“大力出奇跡”，而面壁團隊的做法，是通過小模型預測大模型性能：先在參數量爲0.009B到0.03B的模型上做訓練，再外插到2.4B的模型上預測性能，最後，訓練2.4B的模型。

這一方法事半功倍，先在小模型上做實驗、調參數，可以降低訓練成本。

公司成立之前，作爲北京智源人工智能研究院“悟道”項目的成員，面壁團隊從2020年就開始訓練語言大模型。

過往經驗，讓他們知道大模型需要什麼樣的數據。

“大家很容易陷入一個誤區，過度關注數據的絕對量。其實，數據的質量，如何利用數據，以及對數據的認知纔是更重要的事。”曾國洋稱。

因資源受限，團隊很早就使用分佈式加速、參數微調等方法，降低成本。2022年，面壁團隊參數微調的工作，還發表在Nature子刊上。

生數科技的打法類似。

技術路線上，生數採用的是和Sora一樣的融合架構，但在產品路徑上，兩者不同。

Sora團隊選擇all in長視頻，其背後有Open AI的技術實力，以及微軟的算力支持。初創公司生數科技的條件，無法與之媲美。

唐家渝團隊選擇從2D圖像開始，再拓展到3D和視頻領域。

視頻本質上是圖像在時間序列上的擴增，可以看成連續多幀的圖像，在圖像上的工程化工作，比如數據的收集、清洗、標註以及模型的高效訓練等經驗，是可以複用的。

整個2023年，生數主要資源都放在了圖像和3D上。到今年1月，才上線4秒短視頻生成。2月，Sora發佈之後，該公司進展加速，4月可生成16秒短視頻。

大模型賽道，國內外各團隊競相“秀肌肉”。這兩支清華系團隊，剛開始熱身，期待跑出不俗的成績。

屆時，入股早的華爲哈勃，有望獲得超額收益。

華爲哈勃，悄悄投了清華兩撥人

相關資訊