別再譴責谷歌搜索存偏見了!這是算法複製放大現實世界偏見所致

本站科技訊9月1日消息,據CNBC報道,首先,我們需要澄清下:美國總統唐納德·特朗普(Donald Trump)本週針對谷歌指控是毫無根據的。特朗普宣稱,這家搜索引擎出於政治原因,在其搜索結果中更多顯示反對特朗普的新聞內容。此外,特朗普還聲稱,谷歌在其主頁上推薦了前總統巴拉克·奧巴馬(Barack Obama)的國情諮文演講,而沒有推薦他的演講。這也是錯誤的,因爲截圖顯示谷歌確實鏈接到了特朗普今年的演講。

圖:2018年5月8日,谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)在美國加州山景城舉行的谷歌I/O開發者大會上發表講話

但這就是本文爲“谷歌辯護”得出的結論。因爲,不管特朗普是否知道,他的錯誤指控引發了對谷歌、其偏見及其影響力的一系列長期擔憂。順着特朗普的指控擴展開來,你會發現一系列令人不快的事實,它們對谷歌和社會來說都是不舒服的,因爲它們突顯了我們是如何受制於這家公司的,以及我們對它許多影響全球的隱形方式制衡如此至少。

特別值得一提的是,大量研究表明,谷歌還有另一種偏見值得擔憂。特朗普所謂的“赤裸裸的黨派偏見”不太可能發生,但它有個隱藏潛在問題、普遍而經常未被意識到的偏見,比如搜索“黑人女孩”谷歌會導向色情網頁鏈接,輸入短語“黑人女性爲何如此”總會伴隨着“憤怒”和“喊叫”的場景,或者搜索“大猩猩”會顯示黑人照片等。

在《壓迫算法:搜索引擎如何強化種族主義》(Algorithms of Oppression: How Search Engines Reinforce Racism)這本書中,舉了許多上述類似例證。雖然谷歌已經爲之道歉並修復了這些例子,但這些場景的變體不斷涌現。該書作者、南加州大學安嫩伯格交流學院教授薩菲亞·

布爾博士(Safiya U. Noble)認爲,許多人對谷歌有錯誤的認識。我們曾認爲搜索引擎是個中立的甲骨文,就好像該公司以某種方式整合電腦和數學,客觀地從垃圾中篩選出真相。

但谷歌實際上也是由有偏好、有自己觀點以及有盲點的人創建的,他們在具有明確財務和政治目標的公司結構中工作。更重要的是,由於谷歌的系統越來越多地由從現實數據中學習的人工智能(AI)工具創建,它放大社會中存在的許多偏見的可能性也越來越大,甚至其創造者都不知道這些偏見。

谷歌表示,它意識到搜索結果中可能存在某些偏見,並已採取措施加以預防。谷歌搜索排名團隊的負責人潘杜·納亞克(Pandu Nayak)說:“我們已經做出承諾,要不斷改進搜索結果,以有效、可擴展的方式不斷解決這些問題。我們沒有坐下來忽視這些問題。”

多年來,諾布爾博士、其他研究隱藏偏見的人以及許多對谷歌影響力持批評意見的企業,比如經常與之作對的Yelp,始終在試圖就這家搜索公司如何影響在線言論和商業展開公開討論。現在,人們擔心特朗普的錯誤指控可能會破壞這種工作。弗吉尼亞大學媒體研究教授希瓦·瓦伊德哈亞納桑(Siva Vaidhyanathan)專門研究谷歌和Facebook對社會的影響,他說:“我認爲特朗普的抱怨毀掉了很多好的、複雜的想法,這些想法開始影響公衆對這些問題的意識。”

諾布爾博士認爲,更具建設性對話對於“控制信息領域的壟斷”有好處。所以,我們應該就此展開建設性對話。

谷歌最重要的決定是保密

在美國,大約80%的網絡搜索是通過谷歌進行的。在歐洲、南美和印度,谷歌在搜索領域所佔份額甚至更高。谷歌還擁有YouTube和Gmail等主要通信平臺,並控制着Android操作系統和應用店。它是全球占主導地位的互聯網廣告公司,通過這項業務,它還塑造了數字新聞市場。

谷歌的力量本身並不具有破壞性。重要的問題是它如何管理這種力量,以及我們如何監督它。這就是批評人士所說的失敗之處。谷歌對公共話語的影響主要是通過算法產生的,其中最主要的是決定你在其搜索引擎中看到哪些結果的系統。這些算法是秘密的,谷歌稱這是必要的,因爲搜索是它的“金鵝”(它不想讓微軟旗下必應知道谷歌爲何如此偉大),還因爲解釋算法的精確工作方式會讓它們容易被操縱。

但這種最初的保密造成了令人不安的不透明。因爲搜索引擎在搜索的時候會考慮時間、地點和許多個性化因素,所以你今天得到的結果不一定和我明天得到的結果匹配。這使得外界很難對谷歌的結果進行偏見調查。本週,很多人取笑特朗普爲了支持自己的主張而提出的證據太少。但研究人員指出,如果谷歌以某種方式失控,並決定支持某個受青睞的候選人,那麼只需要改變一小部分搜索結果就可以做到。如果公衆確實發現了這類事件的證據,可能也無能爲力。

馬里蘭大學法學院教授弗蘭克·帕斯誇裡(Frank Pasquale)說:“對於如何調查和識別這些說法,我們真的必須有更復雜的認識。”在2010年發表在《法律評論》的文章中,帕斯誇裡概述了聯邦貿易委員會(FTC)和聯邦通信委員會(FCC)等監管機構獲取搜索數據的方式,以監控和調查有關偏見的指控。沒有人接受這個想法。Facebook最近草擬了一項計劃,允許學術研究人員訪問其數據,以調查偏見等問題。

谷歌沒有類似的項目,但納亞克博士說,該公司經常與外部研究人員共享數據。他還認爲,谷歌的搜索結果不像人們想象的那樣“個性化”,這表明搜索偏見出現時很容易被發現。納亞克指出:“我們所有的工作都是公開的,任何人都可以評估它,包括我們的批評者。”

搜索偏見反映了現實世界的偏見

特朗普聲稱的那種地毯式的、故意爲之的偏見,必然會涉及到谷歌的許多員工。而谷歌當前也在許多熱點問題上糾纏不清,比如多樣性或者是否與軍方合作等,有政治頭腦的僱員向媒體提供了重要信息。如果有傳言說谷歌的搜索團隊正在扭曲政治目的,我們很可能會在媒體上看到這種陰謀的證據。

這就是在研究算法偏見問題的研究人員看來,爲何更緊迫的問題不是谷歌故意對某個主要政黨存在偏見,而是對那些在社會中尚未掌權的人存在偏見。這些人包括女性、少數族裔以及其他缺乏經濟、社會和政治影響力的人,他們被這家由加州富人經營的公司所忽略。正是在這些盲點上,我們發現了谷歌存在的最具問題的偏見,比如它曾經建議對搜索“自學微積分英語專業”中的女性反身人稱代詞(herself)更正爲男性(himself)。

谷歌的解釋一點兒都不奇怪,因爲網上用後者更普遍,所以谷歌的電腦認爲這就是正確的。換句話說,社會上長期存在的結構性偏見在網絡上得到了複製,這反映在谷歌的算法上。最終,這個錯誤被修復了,但是在谷歌中還隱藏了多少這樣的錯誤呢?我們同樣不知道。

谷歌表示理解這些擔憂,並經常解決這些問題。2016年,有些人注意到谷歌將否認大屠殺網站列爲搜索“大屠殺發生過嗎?”的結果頂部,這讓該公司開始着手解決仇恨言論和網上的錯誤信息。納亞克博士說,這種努力表明:“當我們看到現實世界的偏見使搜索結果變得更糟糕時,我們就會試圖觸及問題的核心。”

谷歌最近逃脫了審查

然而,我們應該擔心的不只是這些意外的偏見。研究人員還指出了其他問題:谷歌的算法傾向於時效性和活躍性,這就是爲什麼在重大新聞事件發生後,谷歌的算法往往容易受到操縱,容易受誤導和謠言的影響。谷歌表示,它正致力於解決錯誤信息。谷歌的許多競爭對手指責說,在搜索結果中,谷歌更喜歡自己的內容,而不是第三方網站內容。例如,它會突出顯示谷歌的本地評論,而不是Yelp對本地搜索查詢的迴應。

歐洲監管機構已經因爲這種搜索偏見對谷歌處以罰款。2012年,美國聯邦貿易委員會反壟斷調查人員在谷歌發現了不公平搜索行爲的可信證據。然而,該機構委員一致投票反對提起訴訟。谷歌也否認有任何不當行爲。谷歌面臨的危險是,無論特朗普的指控多麼不實,都爲討論這些合法問題創造了機會。此前,猶他州共和黨參議員奧林·哈奇(Orrin Hatch)呼籲聯邦貿易委員會重啓谷歌調查。可能還會有更多類似情況。在過去的幾年裡,Facebook經受住了社會對大型科技公司的質疑。現在,谷歌被推上了風口浪尖。(小小)