咪咕申請大模型相關專利,提高大模型對視頻處理的準確度

金融界2024年11月27日消息,國家知識產權局信息顯示,咪咕文化科技有限公司申請一項名爲“大模型的訓練方法、視頻處理方法、裝置及相關設備”的專利,公開號 CN 119026075 A ,申請日期爲 2024 年 8 月。

專利摘要顯示,本申請提供一種大模型的訓練方法、視頻處理方法、裝置及相關設備,該方法包括:對樣本視頻進行預處理,得到多個視頻幀、時間戳指令文本和任務指令文本;對時間戳指令文本和任務指令文本進行分詞,得到時間戳指令分詞文本和任務指令分詞文本;對多個視頻幀、時間戳指令分詞文本和任務指令分詞文本進行特徵轉換,得到第一目標特徵;使用第一目標特徵對預設大模型進行指令調整,得到目標大模型。本申請通過將樣本視頻進行預處理後得到多個視頻幀、時間戳指令文本和任務指令文本,並由此進行特徵融合和轉換,得到第一目標特徵並對預設大模型進行指令調整,得到目標大模型,更好地考慮視頻動作和文本描述的關係,提高了大模型對視頻處理的準確度。

本文源自:金融界

作者:情報員