科大訊飛申請多模態交互專利,能夠實現多模態交互,提升用戶體驗

金融界2024年10月18日消息,國家知識產權局信息顯示,科大訊飛股份有限公司申請一項名爲“多模態交互方法、裝置、電子設備和存儲介質”的專利,公開號 CN 118782044 A,申請日期爲2024年6月。

專利摘要顯示,本發明涉及人機交互技術領域,提供一種多模態交互方法、裝置、電子設備和存儲介質,其中方法包括:接收車內的用戶語音;對所述用戶語音進行識別,得到識別文本,並對所述識別文本進行意圖理解,獲得意圖信息;基於所述用戶語音和/或所述意圖信息,獲取所述意圖信息對應的圖像,所述圖像基於車內攝像頭和/或車外攝像頭採集得到;基於所述識別文本和所述圖像,確定交互結果。本發明提供的方法、裝置、電子設備和存儲介質,通過將語音和視覺信息相融合,能夠實現多模態交互,使得交互過程更加自然、準確、智能和靈活,從而大大提升用戶的交互體驗。

本文源自:金融界

作者:情報員