《路透》:字節跳動計劃使用華爲升騰晶片訓練新AI模型

知情人士聲稱字節跳動計劃使用華爲升騰910B晶片訓練新的AI大模型,但是這款晶片供貨速度太慢,尚無法滿足其需求。(圖/搜狐網)

據外媒引述知情人士消息稱,大陸短視頻抖音母公司字節跳動正計劃爲其熱門的國際版短視頻TikTok開發一種新的AI模型,受到外界格外矚目的是,這款AI模型將主要用華爲的晶片進行訓練。

《路透》報導稱,字節跳動已將目光轉向中國大陸的AI 晶片供應商,同時也加快自主研發的步伐。在這場AI競賽中,字節跳動的下一步動作是使用華爲升騰910B晶片來訓練AI大模型。

第4位知情人士也稱,字節跳動計劃建設一個新的AI模型,但「不能透露」是否會使用華爲晶片。

前述3位知情人士表示,字節跳動已經開始使用升騰910B晶片,主要用於計算強度較低的推理任務,即利用預先訓練好的AI模型進行預測。

但是,訓練AI模型對算力的要求要高得多,需要海量資料,因此必須使用超高性能晶片。上述的其中一位知情人士表示,從計算參數來看,新模型的能力和複雜程度將低於字節跳動現有的AI模型「豆包」。

報導說,字節跳動沒有回覆置評請求,TikTok 華盛頓特區發言人休斯(Michael Hughes)否認了這一消息。他說,「這裡的整個前提都是錯誤的,沒有開發新的模式。」華爲則沒有回覆《路透》的置評請求。

知情人士還表示,字節跳動今年訂購了 10 萬多塊升騰910B晶片,但截至今年 7 月,收到的不足3萬片,供貨速度太慢,因此無法滿足公司的需求。