☰

百度申請文檔圖像還原及多模態大模型訓練方法和裝置專利，可編輯文件還原文檔內容

金融界2024年10月29日消息，國家知識產權局信息顯示，北京百度網訊科技有限公司申請一項名爲“文檔圖像還原及多模態大模型訓練方法和裝置”的專利，公開號 CN 118823798 A，申請日期爲2024年6月。

專利摘要顯示，本公開提供了文檔圖像還原及多模態大模型訓練方法和裝置，涉及計算機視覺、深度學習以及大模型等人工智能領域。其中的方法可包括：獲取待處理的目標文檔圖像；將目標文檔圖像作爲多模態大模型的輸入，得到輸出的第一文件，第一文件爲符合預定表示格式的超文本標記語言文件；根據第一文件生成作爲還原結果的第二文件，第二文件爲可編輯的文件，且第二文件中包括目標文檔圖像中的文檔內容。

本文源自：金融界

作者：情報員

百度申請文檔圖像還原及多模態大模型訓練方法和裝置專利，可編輯文件還原文檔內容

相關資訊