阿里巴巴AI模型在閱讀測驗SQuAD 以82.44高分擊敗人類

美國史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網,下同)

大陸中心綜合報導

阿里巴巴與微軟近日都參加了由美國史丹福大學發起的SQuAD(Stanford Question Answering Dataset)問答挑戰賽,他們各自使用自家研發的人工智慧(AI)閱讀系統來回答問題,在經歷10萬條問題的隨機測驗後,雙方都在測驗中擊敗人類所創造的最高分數82.304,刷新紀錄

據《CNET News》報導,人類過去在SQuAD測驗拿下最高的成績是82.304分,這次阿里巴巴研究部門 iDST所開發的人工智慧(AI)機器學習模型,在回答完一份由10萬條題目所組成的題目庫問題後,在 1 月 5 日以82.44分的分數首度超越人類,接着微軟在相同的測驗中,在1 月 3 日以82.650分同樣超越人類記錄

報導指出,阿里巴巴旗下資料科學技術研究所(Institute of Data Science and Technologies,iDST)首席科學家Luo Si表示,很榮幸能見到這歷史性的一刻,未來也會將此技術應用在各種不同的領域上,「這項科技可以應用在客服美術館導覽,甚至是回答病患醫療問題。」

▼阿里巴巴與微軟並列第一,分別以82.4跟82.65分打破人類最高紀錄82.3分。

報導提及,這項測試吸引了Google、Facebook、IBM、微軟、卡內基梅隆大學、史丹福大學等研究單位參加。另外,許多單位也會在一年內,多次參加測驗來了解AI系統進步的進度,例如微軟在 2017 年 12 月 17 日得到 82.136 的成績,而阿里巴巴則是在同年 12 月 28 日獲得 79.199 分。

另據《中評社》17日報導,微軟亞洲研發中心助理主管周明(Ming Zhou)表示,史丹福大學問答數據集的結果具有很重要的意義,但人類仍然比機器更擅長理解語言複雜性以及分辨細微的差別,「自然語言處理領域依然存在不少挑戰,需要我們進一步努力,這個小小的成就只不過是個開始。」

SQuAD爲世界公認最具挑戰性的機器閱讀測試之一,系統內建了大約500篇的維基百科文章,以這些文章爲基礎編輯出超過10萬個問答,挑戰者需要構築機器學習模組來回答問題。這類的資料集一開始是爲了機器學習研究所設計,用以建置解答預測模型。

▼近年來,許多國家都在積極發展人工智慧(AI)。(圖/CFP)

版權聲明:圖片爲版權照片,由CFP視覺中國供《ETtoday新聞雲》專用,任何網站報刊電視臺未經CFP許可,不得部分全部轉載,違者必究!