淘寶申請圖像生成方法及裝置專利,解決生成場景圖視覺效果差的問題

金融界 2024 年 10 月 31 日消息,國家知識產權局信息顯示,淘寶(中國)軟件有限公司申請一項名爲“圖像生成方法、目標文生圖生成式模型的生成方法及裝置”的專利,公開號 CN 118840447 A,申請日期爲 2024 年 9 月。

專利摘要顯示,本申請公開了一種圖像生成方法、目標文生圖生成式模型的生成方法及裝置。涉及人工智能領域,該方法包括:接收包含目標物體的前景圖片和目標物體對應的文本信息;通過目標多模態視覺語言模型依據前景圖片和文本信息,確定目標物體對應的目標場景的描述信息和佈局信息;通過目標文生圖生成式模型依據前景圖片、描述信息以及佈局信息生成目標物體的場景圖,其中,目標文生圖生成式模型是依據訓練樣本集對初始文生圖生成式模型進行訓練得到的。本申請解決了相關技術中依據人工輸入的文本描述信息生成物體的場景圖,存在文本描述信息的準確性較低,導致生成場景圖的視覺效果較差的技術問題。

本文源自:金融界

作者:情報員