百度申請文檔圖像還原及多模態大模型訓練方法和裝置專利,可編輯文件還原文檔內容
金融界2024年10月29日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“文檔圖像還原及多模態大模型訓練方法和裝置”的專利,公開號 CN 118823798 A,申請日期爲2024年6月。
專利摘要顯示,本公開提供了文檔圖像還原及多模態大模型訓練方法和裝置,涉及計算機視覺、深度學習以及大模型等人工智能領域。其中的方法可包括:獲取待處理的目標文檔圖像;將目標文檔圖像作爲多模態大模型的輸入,得到輸出的第一文件,第一文件爲符合預定表示格式的超文本標記語言文件;根據第一文件生成作爲還原結果的第二文件,第二文件爲可編輯的文件,且第二文件中包括目標文檔圖像中的文檔內容。
本文源自:金融界
作者:情報員
相關資訊
- ▣ 北京大學申請中文醫學大語言模型訓練方法及裝置專利,提高大語言模型在醫學領域回答的準確度
- ▣ 百度申請文本檢測及文本檢測模型訓練方法專利,可獲得待檢測文本的目標粒度的目標檢測結果
- ▣ 華爲申請圖像文件編解碼方法專利,提高圖像文件壓縮率
- ▣ OPPO申請圖像編輯方法專利,提高圖像編輯效率
- ▣ 威海藍海銀行申請基於多模態融合的文檔圖像篡改檢測方法專利,解決圖像篡改檢測的技術問題
- ▣ 青島道可雲申請物體模型展示方法及系統專利,能夠更真實地還原模型細節
- ▣ 騰訊科技申請一種模型處理方法專利,提高文生圖模型的圖像生成質量
- ▣ 騰訊公司申請圖片生成方法及裝置等專利,能夠使得文生圖模型的應用更加便捷
- ▣ 寧波博登智能科技申請基於多模態大模型的通用圖像標註系統及方法專利,標註精度高
- ▣ 百度取得融合文本和自動駕駛數據進行模型訓練的方法和車輛專利
- ▣ 南京際舟電子科技申請智能化多模態信息識別與分類管理系統及方法專利,實現多模態文檔的準確分類
- ▣ 九章雲極申請多模態大模型圖像處理專利,提高機器學習模型處理圖像的效率
- ▣ 通用文檔理解新SOTA,多模態大模型TextMonkey來了
- ▣ 騰訊公司申請模型訓練專利,提升模型訓練效果
- ▣ 中國鐵塔申請算法模型的授權方法及裝置專利,實現算法模型的安全授權
- ▣ 智源發佈原生多模態世界模型Emu3,實現圖像、文本、視頻大一統
- ▣ 百度申請圖像處理專利,對圖像和文本進行高效匹配
- ▣ 東風集團股份申請模型軟件的自動化測試方法及裝置專利,提高模型軟件 MIL 測試效率
- ▣ 書行科技申請圖像生成方法及裝置相關專利,能準確轉換圖像風格並保持內容
- ▣ 海信視像申請顯示設備、方法及可讀存儲介質專利,能夠更加真實地還原圖像
- ▣ 百度申請圖像生成等專利,生成包括目標對象的編輯圖像
- ▣ 北京火山引擎申請一種文檔識別方法專利,極大提升文檔識別的準確性
- ▣ 百度在線申請交通大模型訓練專利,提高通行時間預測準確度
- ▣ 普強(北京)申請“構建 AI 大模型智能體的方法及裝置”專利,提升了 AI 大模型智能體的準確率
- ▣ 浪潮雲申請針對 AI 大模型的模型數據錄入專利,提高模型訓練效率和準確性
- ▣ 貝殼找房申請應用程序模型數據加載方法及裝置專利,提高了模型數據的加載速度及應用程序的啓動速度
- ▣ 奇瑞申請白車身模態識別分析方法和裝置專利,提高模態識別分析效率且不易出錯
- ▣ 中國移動通信申請文件編譯方法專利,實現業務應用源文件編譯處理
- ▣ 國科微申請一種算法模型子圖劃分相關專利,能夠靈活平衡編譯速度和編譯後模型運行效率