阿里雲申請複合信息實體抽取專利,可從待處理文檔中抽取複合信息實體
金融界2024年12月12日消息,國家知識產權局信息顯示,阿里雲計算有限公司申請一項名爲“一種複合信息實體抽取方法及裝置”的專利,公開號CN 119106072 A,申請日期爲2023年6月。
專利摘要顯示,本說明書提供了一種複合信息實體抽取方法及裝置。所述方法包括:獲取待處理文檔;其中,所述待處理文檔中包含由若干信息實體構成的複合信息實體。所述複合信息實體包含的字符的數量大於閾值。從所述待處理文檔中抽取代表所述複合信息實體的開頭部分的第一類信息實體,以及代表所述複合信息實體的結尾部分的第二類信息實體。基於所述第一類信息實體和所述第二類信息實體,確定所述待處理文檔中包含的所述複合信息實體,並抽取確定出的所述複合信息實體。
本文源自:金融界
作者:情報員