對話大模型“六虎”MiniMax閆俊傑:做AI技術很奢侈,每個月看到賬單都會心疼
出品 | 搜狐科技
作者 | 樑昌均
運營編輯 | 王一晴
“技術做不好,所有東西都是問題;技術做好了,似乎所有問題都被掩蓋了。技術是一家科技公司的最核心的要素,這件事我花了兩年才意識到,但偶爾還是會繼續犯這樣的錯誤。”
談到創業近三年以來的關鍵時刻,MiniMax創始人&CEO閆俊傑講述了他的數次至暗時刻裡最有共性的一個感受。
MiniMax是國內AI大模型“六虎”中最早成立的一家公司,2021年底由商湯科技前副總裁閆俊傑創立。這家公司最新估值達25億美元,同時獲騰訊、阿里入股,但以往卻極爲低調。
8月的最後一天,MiniMax在上海舉辦了首屆Link夥伴日活動,打破了長久的沉默。閆俊傑現場分享了創業歷程,宣佈推出視頻模型和音樂模型,並介紹了在技術研發上的最新進展。
“大模型是一個看起來很熱,但也有很多非共識的領域——到底做2B還是2C,到底做國內還是做海外,Scaling law到底能不能延續?”
閆俊傑表示,自己對技術的進步充滿樂觀,對用戶充滿樂觀,對產品的迭代效率充滿樂觀。
他還首次面向搜狐科技等媒體迴應了外界的諸多疑問,包括入局AI生成視頻的考慮,以及對技術研發、市場競爭以及海外佈局的看法。
閆俊傑(中)在媒體溝通會上
AI生成視頻會進步非常快
商業化對大模型是考驗
今年以來,AI生成視頻無疑是大模型領域最卷的賽道。自OpenAI發佈Sora演示視頻後,字節、快手、智譜、Pika、Runway等國內外多家企業陸續推出相關產品。
MiniMax是最新的入局者,且發佈即上線。閆俊傑解釋稱,做視頻符合公司的目標,最本質的原因在於,人類社會的信息交流,大部分體現爲多模態的內容,而不是文字。
“爲了有非常高的用戶覆蓋度和使用深度,唯一的辦法就是做輸出動態的內容,而不是單純基於文字。只是我們先做出來文字和聲音,現在技術變得更強,把視頻也做出來。”
閆俊傑坦言,做視頻挺難,複雜度比文本更高,且存儲要求更大,需要在算法上考慮怎麼樣降低複雜度,壓縮率變得更高。“這花了我們很多精力,就比可靈晚了一兩個月。”
同時,這需要升級底層基礎設施,之前基於文本構建的基礎設施,如何清洗、標註數據等,對視頻都不太適用,且視頻開源東西很少,很多都需要自己做,需要更多耐心。
目前,MiniMax的視頻模型僅支持文生視頻。閆俊傑表示,後續會在數據、算法上繼續迭代,且會推出圖生視頻,文+圖生成視頻,可編輯、可控性等更多功能。
在商業化方面,不少視頻生成產品都採取收費模式。對此,閆俊傑表示,在達到一個更加滿意的狀態之後,可能會考慮商業化。
他認爲,AI生成視頻這件事還只是開始,接下來的進步速度一定會變得非常快。“長期看,進步越快的東西就越好。”
這一定程度也代表了閆俊傑對大模型商業化的態度。“目前最重要的不是商業化,而是真正地讓技術到達廣泛可用的程度。”
他表示,當一個產品沒人用,或當一個產品不賺錢的時候,肯定不能怪用戶,大部分時候只能怪自己的技術做得不夠好,或產品做得不夠好。
目前,MiniMax的商業化基本分成兩個形式,一個是開放平臺,服務超3萬家企業用戶和開發者,並有兩千多家付費客戶。第二是C端,嘗試廣告或收費變現。
MiniMax國際業務總經理盛靜遠在溝通中表示,2B行業真正要能賺錢是要成爲行業標準,但在國內更加捲的競爭市場上,2B業務很多變成了項目制。“大模型如果純技術輸出,爲每家企業進行定製,這個商業模式就轉不過來。”
“今天的大模型產品形態,普通消費者沒有任何忠誠度,一旦收費就可以換到另外一個產品。”盛靜遠認爲,大模型C端產品的商業模式也不成立。
她表示,MiniMax所有產品會結合技術的能力、特色,打造出能增強用戶粘性的產品形態,然後纔會考慮ROI和留存,等到飛輪轉起來,再去進行投放,而不是像很多友商,現在就用非常多的真金白銀砸進去。
“我們現在是所有中國大模型公司裡面,少數幾個能講商業化變現,能講產品跟模型驅動,甚至很有可能能在比較短的時間內實現自負盈虧及盈利的公司。”盛靜遠表示。
她認爲,MiniMax現在處在半山腰的狀態,如果做得比較成功,很快就能達到一個正向的商業循環,希望通過技術突破,產品商業化,從而再反哺技術,而不是考慮還有那些錢會來投。
“大模型的商業化,如同當年的互聯網一樣,會經歷一個探索的過程。這可以看成是對一個行業的考驗,如果能通過就能夠出來,如果通不過就應該客觀面對。”閆俊傑說。
做技術非常奢侈
大模型未來關鍵是錯誤率要降到個位數
在創辦MiniMax前,閆俊傑已做了超過十年的AI技術研發,人臉識別和AlphaGo是那時最具代表性的應用。“這些距離人都很遠,對我來說也越來越困惑,做AI到底是爲了什麼?”
轉折發生在閆俊傑一次回老家見到外公。“他想寫自己80年的一生,但不會打字,也不會進行復雜的寫作。很遺憾我沒法幫他來完成這件事情,那時候的AI還做不到。”
“這給了我非常大的觸動,讓我意識到,AI應該具備通用性,讓每個人都有智能,總結來說就是 Intelligence with everyone。”閆俊傑說,這成了創業最初的想法。
隨着大模型浪潮到來,MiniMax率先推出首個MoE(混合專家系統)大語言模型。目前,公司模型覆蓋文本、語音、音樂、視頻等領域,並推出開放平臺、海螺、星野、Takie等多款產品,不久還將發佈採用新一代技術的abab7系列文本模型。
“但我們的用戶還只佔全球總人口的1%,準確地說是0.8%。那怎麼來提升呢?我認爲核心只有兩點:提高用戶的滲透率和使用深度。”閆俊傑稱,這需要堅持科學技術是第一生產力。
他認爲,大模型最重要的三個技術方向是:持續降低錯誤率、無限長輸入和輸出和多模態。這需要在模型算法上不斷創新,MiniMax就曾投注公司80%的資源押注MOE。
此次活動上,MiniMax推出基於MOE+ Linear Attention(線性注意力)的新一代模型架構,其能夠在單位時間內更加高效地訓練海量數據,提升模型的實用性和響應速度。
相較GPT-4o,該模型處理10萬token時效率可提升2-3倍;相比通用Transformer架構,該架構能大幅減少大模型訓練和推理成本,如在128K的序列長度下,成本減少超90%。
“我們一直都覺得技術重要,但跟100%地認爲它重要,需要一個過程。”閆俊傑表示,做技術是一件非常奢侈的事,它具有不可預測性,可能會失敗。
同時,研發投入很大。“如果看一眼我們每個月的賬單,還是會非常心疼。”閆俊傑說着看向了坐在旁邊一同參加溝通會的技術負責人,“這就是行走的人民幣”。
“當一個東西很奢侈的時候,很多時候就會想要不要走點捷徑,比如可不可以先把產品提升好。但我們的實踐證明,走捷徑的時候就會被打臉,至少我犯了類似超過十次的錯誤。”
閆俊傑表示,打臉的結果就是,本來認爲技術的重要性有70%,打臉一次75%,再打臉一次80%,直到現在認爲技術是最核心的要素。
“對創業來說,一塊錢要分成幾瓣來花。”閆俊傑說,自己對技術的理解慢慢變得非常簡單,第一性原理是,做技術特別是做很大研發投入的技術,追求的東西不應該是5%、10%的提升,而是研發那種能夠帶來幾倍變化的技術,這也是MiniMax堅持的方向。
不過,目前無論是OpenAI,還是國內外大廠、初創公司,都面臨着技術增長曲線放緩的困境。閆俊傑認爲,大模型未來一個非常本質的變化是錯誤率從兩位數下降到個位數。
“這首先是數量級的提升,其次可以讓很多複雜任務從不可做變成可做。爲什麼現在沒有Agent可以跑通,GPT store也跑不通,不是因爲Agent的框架不夠好,或者產品不夠好,根本原因是模型本身不夠好,技術不夠好。”
作爲AGI的信仰者,閆俊傑信奉Scaling law的力量。“當計算量增長不止10倍,算法也快了10倍的時候,沒有道理訓練不出來一個更好的模型。”
“大部分中國公司比美國公司落後,但按照我們現在的技術進展,再加上國外的技術資源,肯定能做出更好的模型。如果他們的能力更強,顯然會做得更好。”
競爭對大模型行業是好事
打不贏就應該被淘汰
雖然閆俊傑強調MiniMax是一家技術主導的公司,但外界更多感知來自產品,尤其是出海。
“我們國內用戶量不比海外小,但不太知道爲什麼只覺得我們出海做得好。我們的技術非常領先,但大家總覺得我們產品做得好,我不太理解爲什麼會這樣。”閆俊傑說。
搜狐科技瞭解到,目前MiniMax旗下產品全球用戶超過6000萬,每日與全球用戶進行超30億次交互,處理超3萬億文本token、2000萬張圖片和7萬小時語音,單日交互量居國內AI公司首位;單日總交互時長超4億分鐘,從一年前佔ChatGPT的3%提升到53%。
目前,MiniMax旗下的Takie成爲國內AI出海的代表性產品之一,公開數據顯示其月活超過千萬。
盛靜遠在溝通中表示,Takie背後有對人性的深入思考,考慮了AI在高容錯率下能做到的程度。“Character AI被谷歌收購後,我們成了賽道的扛大旗者,很有可能成爲現象級產品。”
她認爲,在海外用戶付費習慣更好且產品夠好的情況下,會用更多資源在海外進行推廣,而海外市場會有一套自己的打法,相對比較直接,變現也會更快。
閆俊傑認爲,去年中國的大模型在海外完全沒有競爭力,接下來出現了百模大戰,包括價格戰,非常顯著地提高了大模型的調用量。
“正是因爲這麼激烈,也推動了大家必須把模型做好,到了一定階段之後,發現在海外越來越具有競爭力,在非英語國家的語種上,比如中文,已經做到能跟GPT不相上下的水平。”
當然,MiniMax也難以避免國內外大廠及其它創業公司的競爭,如字節、快手、百度等都在佈局情感陪伴賽道,國外的競對Character AI則被谷歌收購。“這是一個比較好的結局,似乎每個人在裡面都得到了好處。”閆俊傑說。
但閆俊傑強調,星野的產品底層設計不是陪聊或是情感陪伴,而是基於AI的新一代內容社區。據瞭解,星野的用戶畫像以二三線城市爲主,年齡是在17-24/25歲之間。
對於大模型賽道的競爭,閆俊傑認爲,這整體是一件好事,大模型有可能會產生很大的社會價值,確實應該有很多競爭。
“我們作爲一家創業公司,競爭不能避免,既然不能避免,那就努力做到最好。如果在競爭中打不贏,那就應該被淘汰,就應該關掉,也沒有其它選擇。”
同時,他認爲,大廠的競爭可以讓創業公司很快看清一些非常底層的東西。
“我們能做的就是把有可能變強的事無限地放大,一是技術如何提升,二是如何跟用戶做更好的共創。這兩點都需要一些非常關鍵的判斷,需要靠非常長期的積累。”閆俊傑說。