Facebook用數十億張Instagram上傳的照片來訓練AI

記者洪聖壹臺北報導

相較於 Facebook 來說,Instagram分享圖片、影音更爲簡便,而且使用環境更爲單純,這使得人們願意在該平臺分享圖片,而在 F8 開發者大會的第二天,Facebook 談到有關圖像辨識技術時,說明他們使用人們在Instagram分享的數十億張照片訓練圖像辨識模組

其實這些數據訓練的模型對於所有科技公司來說都非常普遍,而Facebook面臨的挑戰除了隱私,更多的是如何整理這數十億圖片的相關內容,好比說在 35 億張Instagram照片當中分類超過17,000個標籤

在 F8 第二天的會議當中,Facebook 向開發者們說明了他們是如何處理了數十億張 Instagram 照片。首先,這些照片被用戶標註了標籤,接着 Facebook 要能夠辨識哪些主題標籤是同義詞,同時還要學習將更具體的主題標籤優先於更一般的主題標籤,最終這些主題標籤將被訓練成大規模的標籤預測模組,接着再使用這些模組來訓練他們自己的圖像辨識模組。

Facebook 表示,他們每天依靠數百臺全天候運行的GPU來解析這些數據,目前已經獲得的成果已經超過業界在圖像辨識的標準,其中最好的成果在 ImageNet 上已經達到了 85.4% 的準確度,這個數據甚至比起 2017 年 Google、微軟公司公開的相關數據還要好上 1% ~2%。

談到關鍵的隱私問題,Facebook 表示,這些圖像的用途在於辨識跟標籤之間的關聯性,而標籤是來自公開、可用的主題標籤,對他們來說,這是一種用數十億圖像積累和培訓軟體形式,如果照片本身沒有標籤,即使機器再厲害,也無法辨識。簡單的說,Facebook 認爲他們只在這些公開的標籤當中提取基於圖像的相關數據,並不一定要從照片內容中推斷用戶行爲。

無可厚非的,這些都代表着一件事,當人們使用 Instagram 分享照片時,不管你願不願意,你每天在 IG 上傳的照片都正在爲 Facebook 的深度學習技術做出貢獻

但從另外一個角度來說,也是因爲有這些貢獻也才能解決人們需求,好比說我們每次上傳一張照片,Facebook的臉部識別系統就可以自動爲照片添加標籤,甚至告訴你是哪個人,並透過手機位置的辨識,告訴你這張照片可能是在哪裡拍的,甚至這種圖像辨識功能,還可以幫助人們快速搜尋資料

Facebook技術長Mike Schroepfer表示,目前 Facebook 大部分的辨識與管理工作都是由AI處理,這包括篩選和清理恐怖主義宣傳裸體暴力仇恨對立言論垃圾訊息人物、內容與平臺。他更強調,Facebook 還需要更多新的突破、新技術來解決所有人想解決的問題。