阿里雲的開源算盤

不久前,IDEA研究院創院理事長沈向洋提出,第一名毫無疑問會閉源、第二名會糾結開源還是閉源,第三名一定會開源。

12月1日,阿里雲CTO周靖人聽到這個觀點時微笑着迴應:"Harry(沈向洋)是有點玩笑話,過去十年以來,整個開源社區已經蓬勃發展起來。"

當天,通義千問開源了多個大模型,實現全尺寸開源,這一場景就發生在通義千問發佈會後。4月,通義千問啓動邀測,8月以來開源了Qwen-14B和視覺理解模型Qwen-V,10月底發佈通義千問2.0版閉源模型。大模型競賽大半年,開源閉源之爭常談常新,不時還會以Android和iOS系統類比。現實是,百度的文心大模型目前尚未開源,OpenAI在開源閉源之間橫跳。差異化的路線反映了企業的不同策略,對阿里雲而言,開源大模型不光牽扯到社區、生態,或許還關係到放緩的營收和整個阿里系的未來。

從1.8B到72B

12月1日,阿里雲通義千問720億參數模型Qwen-72B開源。該模型可以處理最多32k的長文本輸入,在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發團隊優化了Qwen-72B的指令遵循、工具使用等技能,能更好地被下游應用集成。比如,Qwen-72B搭載了強大的系統指令能力,用戶只用一句提示詞就可定製AI助手,要求大模型扮演某個角色或者執行特定的回覆任務。

通義千問還開源了18億參數模型Qwen-1.8B和音頻大模型Qwen-Audio。截至目前,通義千問共開源18億、70億、140億、720億參數的4款大語言模型,以及視覺理解、音頻理解兩款多模態大模型,實現"全尺寸、全模態"開源。

"我們希望把各種模型的參數、所消耗的資源、擁有的能力等清晰地展示給開發者、企業,讓它們根據自己的場景做更好的選擇",談到爲何推出720億參數大模型時,周婧人說。

據不完全統計,目前國內市場已發佈約200多個大模型。易觀分析高級分析師陳晨告訴北京商報記者,"國內主流大模型的競爭領域主要集中在百億級別以上參數檔,幾家頭部廠商的大模型參數量達到千億級以上,在工業製造、醫療、金融、智慧城市領域,需要藉助AI進行大量的識別分析、計算和推理任務,能充分發揮超大規模模型的性能。目前百億級別以下的模型相對較少,這類模型在計算資源有限的情況下,比如在移動端、邊緣設備的應用場景下有很好的表現"。

不光爲生態

"這段時間,已經有不少硬件廠商在跟我們洽淡,我們的心態是非常開放的",周靖人透露。他還多次表示,開源生態對促進中國大模型的技術進步與應用落地至關重要,通義千問將持續投入開源,希望成爲"AI時代最開放的大模型"。

大模型開源社區創新平臺魔搭是阿里雲頻繁提及的另一個詞。根據阿里集團創始人、董事長蔡崇信一個月前披露的數據,魔搭匯聚了280萬開發者、2300多個優質模型,模型下載量超過1億。

在陳晨看來,開源有利於大模型廠商形成更開放的生態,吸引更多研究者或開發者來豐富基於這些模型的應用和服務,也能推動模型持續地優化迭代,"儘管大模型本身是開源的,但仍然可以在這個基礎上提供多種形式的服務,包括定製開發、技術支持、培訓等。大模型的原始開發者在模型理解、技術細節、創新能力、可持續性上都更具優勢,能夠更有效提供定製化解決方案,這也就爲開源大模型廠商帶來了更多的商業化機會"。

2023年三季度,阿里雲營收276.48億元,同比增長2%,經調整EBITA利潤14.09億元。對於這份業績,阿里雲的評價是:"我們通過減少利潤率較低的項目制合約類收入,以持續提升收入質量。與此同時,本季度公共雲產品及服務收入增長,帶動盈利能力的優化。"

第一名不開源?

文淵智庫創始人王超也提到了通義千問開源和阿里雲商業化的關係,"大模型開源還是封閉,最大的考慮是商業考慮和自身優勢,絕不僅僅出於公益目的"。

"大模型開源僅是算法開源。即便開源,其他開發者和公司想要複製,難如登天,它們既沒有大規模算力,更缺乏所需要的數據。阿里雲擁有足夠的算力,即便開源也能保證很多用戶最終會回到阿里雲體系,開源也能帶來社區和生態,對吸引新的阿里雲用戶,鞏固原有的阿里雲客戶,都是不無裨益的",他進一步補充。

不過,並非所有企業都選擇同一路經,如同當年Android和iOS之爭。2007年,第一代蘋果手機改變了科技史,封閉的iOS系統橫空出世。後來,谷歌等研發改良的Android系統,用開源打法,幾乎壟斷了iOS系統以外的全部市場。

當下的大模型競賽,與當年有相似之處,不過閉源的大模型不止一家。提到第一名不開源的觀點,周婧人笑稱,"站的角度不一樣,我們要讓更多人蔘與進來,開源是最佳也是唯一的途徑"。

王超則將阿里雲的選擇上升了一個高度,"阿里雖然不以技術強出身,但大模型天然跟雲計算強關聯,算法、算力和數據都依賴雲計算。阿里雲作爲中國最大公有云公司,是發展大模型的絕佳底座。拼多多即便在電商方面有出色表現,但業務單一,在技術和其他業務儲備不足,阿里雲號稱要用大模型把所有產品重做一遍,阿里雲+大模型就是整個阿里系最大的希望,沒有之一"。

北京商報記者 魏蔚