百模大戰!陸大模型商用降價戰 加速AI市場洗牌
大陸廠商近期紛紛降價,大模型商用加速洗牌。(示意圖:shutterstock/達志)
據大陸《經濟日報》報導,自美國OpenAI公司的ChatGPT引燃全球競賽熱潮後,人工智慧大模型經歷了一年半「技術狂飆」。如今,大模型價格戰又帶來了商用競爭的提速。OpenAI公司近幾個月多次降價,字節跳動、阿里巴巴、百度、騰訊等大陸國內多家大模型廠商近一個月來也競相降價。
促進應用
5月21日,阿里雲旗下9款大模型全面降價,其中,Qwen—Long API輸入價格從0.02元(人民幣,下同)/千tokens降至0.0005元/千tokens,直降超97%。據估算,降價後1元錢約可買到300萬字符,相當於5本《新華字典》的文字量。
阿里雲資深專家朱迅垚分析,「阿里雲大模型降價,是希望讓更多的使用者和中小企業用上大模型,加速AI應用市場的提前爆發。我們有底氣降價,主要得益於公共雲技術紅利和規模效應帶來的成本和性能優勢。」
目前,百度智慧雲千帆大模型平臺共計有7款模型免費開放。百度智慧雲AI與大模型平臺總經理忻舟表示:「大模型仍處於市場培育階段。企業只有在認識到大模型帶來的巨大價值後,才能將其應用於更大規模、更復雜的業務場景中。生態繁榮是大模型行業發展的前提。」
忻舟表示,百度有充分的資源和技術積累,在降價政策發佈前內部已制定專項保障策略,以確保大量客戶涌入時的使用體驗。
從實際數據看,降價確實可以提高大模型獲客量。
百度的兩款主力大模型ERNIE Speed和ERNIE Lite於5月21日宣佈免費開放後,兩週時間其日調用量就漲了10倍。阿里雲宣佈降價後,百鍊平臺上通義千問調用大幅提升,表明很多企業應用大模型的意願增強。
大浪淘沙
2023年大陸國產大模型就已開啓「百模大戰」,如今大陸國產大模型數量超過200個,其中10億參數規模以上的大模型超100個。業內專家普遍認爲,本輪降價潮會加速大模型洗牌。
「國內通用大模型產品高度同質化,無法通過差異化功能來吸引更多消費者,最終造成了本次大範圍降價。」哈爾濱工業大學商學院院長馬濤教授認爲,在大模型技術底層上,大陸國內知名的幾個大模型產品均參考了經典的Transformer等架構,技術路線上存在部分重合;在大模型數據層面上,因爲用於大模型訓練或推理的中文語料庫來源單一、動態更新頻率不高,導致各通用大模型的訓練數據高度相似。
經過2023年的「百模大戰」之後,大陸全國在網信辦登記備案的生成式人工智慧服務數量已連續多月保持在117家不變。馬濤估計,未來中國通用類大模型產品還將經歷一輪大浪淘沙,常見常用的知名大模型數量將最終穩定在10個左右。
誰能成爲勝出者?儲備充足的中國互聯網巨頭們頗具信心。
迎難而上
當前,全球大模型技術競爭異常激烈,各國都在快速迭代技術。從全球已發佈的大模型地域分佈看,中國和美國大幅領先,超過全球總數的80%,中國已形成了緊跟世界前沿的大模型技術羣。
與引領這輪潮流的美國相比,中國在大模型產品和服務上還有哪些不足?
馬濤表示,算力供給上的差距值得關注。近期,輝達宣佈搭載最新架構Blackwell的GPU晶片正式投產,這標誌着目前在全球範圍內性能仍表現非常突出的H100計算晶片已經成爲「上一代」,並與中國大陸存量較多的輝達A100晶片和華爲升騰910B拉開距離,形成了代際差距。
面對客戶的晶片焦慮,百度採取了「兼容」策略。忻舟表示,百度百舸·AI異構計算平臺可以實現一雲多晶,對國內外主流AI晶片兼容,無需爲每個晶片平臺重新設計和優化模型,幫助用戶擺脫單一晶片依賴,節省大量時間和資源。
「中國有超大市場規模和全產業鏈優勢,有巨大的訓練專業知識數據開發潛力,以及海量的大模型專業應用場景和垂直領域落地需求,這是其他國家很難具備的條件,爲我國大模型加快技術迭代和實際應用提供了寶貴的發展機遇。」馬濤說。
朱迅垚表示,對大模型未來應用的增長非常有信心,同時也相信中國在人工智慧領域,尤其是AI原生應用上,一定會走在世界前列。