全球誠信排行,中國倒數第一?我們花了四年時間,推翻了這篇Science論文

希望不同文化下的人

能夠彼此理解、尊重、信任,

讓這個世界少一些極端化的思想,

多一些科學和理性。

楊芊 · 浙江大學教授

格致論道第108期|2023年12月23日 北京

各位朋友大家好,我是楊芊,來自浙江大學公共衛生學院,今天想跟大家分享一個關於中國公民誠實度爭議的科研故事。

Cohn et al., Science published on 2019/06/20

這個故事的由來,要從這篇2019年發表在國際頂級學術期刊《科學》(Science)上的文章說起。它的標題非常直白,就叫做《全球公民誠實度》。來自歐美的學者在全球40個國家開展了現場研究,將一些公共場所作爲實驗點,包括酒店、銀行、郵局、警察局和一些文化場館。然後請一位德國助研到這些場館的前臺交一個錢包,並用英文告訴前臺的服務員:“你好,我在你們門口的轉角處撿到了這個,請你處理一下,我有急事先走了。”

我們來看一下這個所謂的“錢包”,它其實就是一個透明的夾子,裡面有一張名片。名片上除了這個人的姓名和職位信息之外,就只有一個聯繫方式,是電子郵件地址。此外它還有一個便箋、一把鑰匙,有的裡面還放了一些錢。

這篇文章的作者用“前臺給這個電子郵箱發郵件的比例”,作爲衡量全球公民誠實度的唯一標準。這是論文裡一張主要的圖,它對這40個國家進行了一個誠實度的排名。大家找到中國在哪了嗎?沒錯,它被排在倒數第一。

文章發表以後,有超過10個國家的新聞媒體對這篇文章進行了報道,在國內同樣也引起了巨大的爭議。作爲社會和文化科學領域的一名研究者,我覺得這個結果跟我的專業直接是相悖的。首先,中華民族向來以誠信爲美德;其次,我國已經全面脫貧了,大家覺得會有那麼多人爲了錢包裡的幾十元錢就罔顧做人的原則嗎?

這不僅僅是我個人的觀點,也是很多科研人員共同的質疑。很快,浙江大學的周欣悅教授和清華大學的孫亞程教授在《科學》雜誌原文的評論區發表了一個辯駁,他們指出這個實驗是有硬傷的。但是,《科學》的編輯卻認爲他們沒有進行鍼對性的複製實驗,所以沒有給予實質性的迴應。後來因爲評論過多,甚至關閉了這篇文章的評論區。

也因此我們聚焦到了針對性的複製實驗上。我有幸是中國衛生政策與管理學會(CHPAMS)的會員,我們有一個“行爲經濟學”的微信羣,羣主是美國歐道明大學社區與環境健康學系的教授張琪,他和學會的幾位資深創始人一起號召開展這樣有針對性的複製性研究。我作爲最先的響應者之一,邀請了周欣悅老師一起加入。然後用滾雪球的方式,組建了一支足以支撐全國多中心現場研究的社科領域跨學科合作團隊。

怎樣纔算極致的複製?

我們認爲,要還原事情的真相,糾正外界對中國誠實度的誤解,就必須要拿出完整嚴謹的證據,這是我們作爲學者義不容辭的責任。

別看這只是一個複製研究,其實開展起來困難重重。首先,我們合作者裡大部分都是公共衛生領域的研究者,做社會心理學的實驗屬於跨界;其次,我們團隊也沒有人在《科學》主刊上發過文章——別看原文的正文只有短短的5頁,它的補充性材料卻長達93頁,要對這個實驗進行完整嚴謹的複製,就必須要詳細瞭解和精準把握每一個實驗細節;而且爲了儘快地啓動實驗,我們也來不及申請專項的經費,都靠各中心隊長們已有的各項經費支撐。

此外還有一個我個人比較關注的問題:近年來心理學的很多經典實驗都被質疑不可重複,那採用社會科學的方法到底能不能得出一個可信的結論呢?這也是我想追尋的答案。

可靠的實驗需要極致的複製。大家看這個錢包,我們不但要複製錢包的材料、外形和顏色,也包括它的重量和尺寸。再看名片上的這個名字,大家更容易聯想到是一位男性還是一位女性?男性對吧?所以裡面這個便箋也是請男生手寫的。另外,我們從淘寶上訂來的夾子是嶄新的,在用之前還要丟地上,用腳蹂躪兩下,還原它的逼真度。裡面的錢數也根據通貨膨脹率從49塊調整到了52塊。

在原實驗裡,實驗者把錢包交出去以後,就回家苦苦等待郵件的回覆。但是,兩件事之間到底發生了什麼?社會心理學實驗最耐人尋味的就是刺激到反應之間的黑匣子,而原文對這個黑匣子的放棄就是它最大的漏洞。所以,我們一定要想辦法瞭解錢包處理的過程和它的下落。

這就需要我們在原實驗的基礎上,設計新的實驗環節。我們認爲,誠實是一個多面體,不同文化下的人對誠實的定義是不一樣的,如果僅僅只採用單一的測量方法,得出的結果肯定是有偏的。原文的助研是一位外國人,所以我們也聘請了外國的助研,並給他配備了一支有降噪功能的錄音筆,放在他上衣的口袋裡進行隱蔽錄音。但這樣並不能顯示畫面,也沒有辦法跟蹤交接完畢以後錢包的處理過程。所以我們團隊中有老師認爲,必須再增加兩個中國助研,一個負責對錢包處理過程進行隱蔽性跟蹤攝像,另外一個負責測量和記錄環境變量。

但是,另外有合作者認爲,他人在場會促進社會讚許性的行爲,人爲增加旁觀者的數量就會引起旁觀者效應,這是對真實世界研究的一個巨大幹擾。那幾天,微信羣裡各個老師都旁徵博引,感覺關係都快決裂了。

最後我們通過討論,達成共識,就是在原文有錢沒錢的條件之外,再隨機抽取一半的點,中國助研提前15分鐘進入,持續拍攝到錢包被處理到一個靜止的狀態。而另一半的點不跟拍,中國助研完成所有的環境變量測量與記錄後退出,外國助研再進入。

採用這樣的設計,不僅通過對比檢驗旁觀者效應是否存在,又能保留一半對錢包下落的觀察。像這樣對實驗細節的爭論還不止一次,常常讓人覺得友誼的小船岌岌可危。但真理越辯越明,跨學科的討論不僅讓我們的實驗設計更加合理,也讓我們通過精誠合作達成四年的堅持不懈。

測量更多的環境變量

實驗的大致流程確定以後,我所在的杭州被選爲整個實驗的預實驗點。我們不僅測量了原文所有的環境變量,還增加了很多我們認爲可能也會影響誠實行爲的環境變量,包括溫度、溼度、牆上貼的標語、門口的通行狀況、人流的擁擠程度等等。

經過幾輪短短的預實驗,我們發現一個事實:外國助研的注意力主要集中在跟前臺溝通上,所以他們對於一些簡單而重要的事實記錄都是有偏的,比如最重要的也最簡單的,周圍到底有幾個人,都記得不是很準確。這也進一步佐證了設計新的實驗環節的重要意義。

一週後回訪

實驗的另外一個重要創新是在一週以後,由中國助研扮演錢包的失主或者失主的朋友,會回到當初報失的場所認領錢包。當前臺工作人員給回錢包或者是問他要名片上身份信息的時候,我們就進行實驗的揭秘,並對他們進行訪談。這也是爲了滿足欺騙性社會實驗的倫理要求,因爲我們需要向被矇蔽的參與者解釋清楚整個實驗,讓他們知情,並取得他們的諒解和事後的同意。

我們會問,整個處理過程當中都有哪些人、你們沒有關於失物處理的規定、最後有沒有發郵件、誰發的、可不可以給這封郵件拍一張照片,以及你認爲中國人的誠信觀是什麼樣的。

在全國10個城市部署實驗

值得一提的是,開展這種欺騙性的社會實驗,實驗者要面臨巨大的壓力,因爲他們不僅要面對被矇蔽的工作人員的憤怒和質問,還要嚴謹地完成實驗的解釋和訪談工作。

比如我的一位研究生在預實驗過程中,因爲壓力過大,沒能正確說出名片上的名字,前臺覺得她是騙子,就拒絕給她錢包。還有另一位外國助研是個俄羅斯的小姑娘,她在入境的時候被盤問得特別詳細,因此在微信上向我傾訴:“老師,我怕警察叔叔。”面對這樣的情況,我只能不斷地爲我的助研們打氣,給他們支持和鼓勵,幫助他們完成從自我懷疑、彷徨到脫胎換骨的過程。

爲了更好地保護學生,我們還進行了大量準備工作,比如叮囑他們一定要帶學生證,開出各個學校的介紹信,幫他們複製了倫理批件以供攜帶,甚至爲他們畫出了進入和退出這些場館的路線圖。

一一解決了預實驗當中的問題之後,我們就得以在全國其他城市啓動了正式研究。在此,我要致敬所有的合作者們:北部片區的隊長是首都醫科大學的韓優莉和南開大學的呂小康老師,東部片區是我、周欣悅和復旦大學的呂軍老師,南部片區是深圳大學的蔣東紅、華南師範大學的曲琛和廣州中醫藥大學的龔文進老師,西部片區是北京師範大學的劉世勇和他的博士生西南財經大學的張薇薇,以及陝西師範大學的聶景春老師。

最後還有兩個新加入的城市,分別是南京和哈爾濱,隊長是南京醫科大學的劉汝剛和哈爾濱醫科大學的焦明麗老師。其中焦老師是主動請纓加入的,她說東北是中國這麼重要的地區,原文竟然一個現場實驗點都沒有,也太失誤了!

2019年底,全國500個試驗點全部完成

我們必須在最短的時間內完成實驗,因爲這樣的研究一旦引起了媒體的興趣、引爆了輿論,那數據就不再可靠,我們只能終止項目。經過大家的艱苦努力,實驗花了整整半年的時間得以完成。杭州開始預實驗的時候還是盛夏,同學們都頂着40度的高溫在外面跑,而在哈爾濱最後結束的現場已經飄起了鵝毛大雪。全國500多個點在2019年年底之前都完成了實驗是特別幸運的,大家都知道,接下來的幾年裡開展這種依賴現場的實驗變得異常困難。

然後就是繁重漫長的數據處理工作。由於數據量龐大、數據類型多樣,只能通過自我檢查、交叉檢查和最終覈對,來確保數據的可靠性和真實性。張薇薇博士所負責的這項工作佔據了她博士生涯的大量歲月,她也是論文署名作者裡唯一的學生。

中國人其實很誠實

在2021年的時候,我們在各自的城市,看到了這個“中國隊長”微信羣裡發出來的結果。我如釋重負:終於有交代了!可以開始撰寫論文初稿了。

先看圖中左邊橙色的柱子,這是原文采用的指標,“主動通過郵件聯繫的回覆率”。在它的數據裡,在夾子裡有錢的條件下,中國的郵件主動回覆率是21.5%,沒錢的條件是7%。我們複製實驗的結果雖然比原文略高,但是兩者之間並沒有顯著差異。而這一點非常重要,說明我們對實驗的複製是成功的。此外,敏感性分析也證明了中研在不在場並沒有顯著區別。

但再來看額外增加的條件,“一週後錢包的被動找回率”,右邊的綠色柱子,這個結果迅速飆升到了78.6%和77%。也就是說總共500個錢包,有超過3/4都能夠被成功找回。所以,中國人其實是非常誠實的一個民族!

主動聯繫是度量誠實的唯一標準嗎?

那爲什麼兩種不同的測量方式之間有這麼大的差異呢?在找錢包的時候,我們還調查了所有500個點的回訪對象對於誠實標準的看法。前臺工作人員大部分都認可,如果你把錢包據爲己有,那肯定是不誠實的;但是沒有主動聯繫失主,卻並不能算不誠實。這個結果也在後面的全國代表性抽樣的調查當中也得到了完美的復現:中國人更加認可“妥善保管”是測量誠實的適宜方法,卻不是很認同把“主動聯繫”作爲測量誠實度的唯一標準。

誠實觀和集體主義文化相關

那爲什麼中國人的誠實觀更認可妥善保管呢?什麼理論能解釋它?其實文化心理學的經典理論就可以。一個廣爲人知的文化差異,就是集體主義與個人主義的差異。我們採用原文30多個國家主動聯繫比率的數據,跟它們的集體主義文化進行相關分析,發現主動聯繫與集體主義指數呈負相關!也就是說,如果一個國家的集體主義文化得分越高,那麼就越不願意採用郵件回覆對方。

這是因爲,在中國這樣集體主義典型文化佔優的國家當中,我們崇尚行爲的約束、剋制與服從,這比個人主義的彰顯、主動和獨立更加受認可。而妥善保管錢包正是成熟自制的表現,因而比“主動發郵件”更能代表誠實行爲。因此,我們不僅提供了中國人誠實度的證據,而且也揭示了原文的理論疏忽。

社會科學對我們的生活影響深遠

2022年6月,我們的文章投向了《科學》雜誌。10天以後,劉世勇老師的郵箱裡躺了一封編輯的回覆,她表示,由於我們只有一個國家的現場數據,所以不能把我們的研究發表在《科學》主刊上,但她也承諾,不論這篇文章之後發在哪裡,《科學》雜誌都會報道。這讓我們對接下來的投稿之路充滿希望。

《揭秘中國公民誠實度之爭:一項在中國進行的擴展性複製實驗》

2023年7月,我們這支由國內外15所高校組成的跨學科科研團隊,終於在《美國科學院院刊》(PNAS)上發表了這篇擴展性複製實驗。

《科學》副主編Ekeoma Uzogara的評論

《科學》雜誌主編也很誠信,2023年8月10日,她在《科學》的In Other Journals(他刊)欄目對我們的文章進行了報道。她不僅認可我們的研究範式,而且承認僅僅依賴“電子郵件回覆率”會導致對不同文化背景下公民誠實度的評估偏差。

這場歷時4年的科研故事到這裡就告一段落了,我要再次致敬所有的合作者們。其實在旅程當中,我們每個人都收穫良多。比如最早給《科學》雜誌寫評論的孫亞程老師就說:原文讓他感到被冒犯,所以他寫的評論帶了情緒。但是情緒並不能迎來尊重與對話,基於事實的證據遠勝過於情緒性的對抗。

這些是我們可愛的同學們,他們是這場實驗的“幕後英雄”。我們在每一個城市都有50個實驗點,有些點之間相隔數十公里,所以他們幾乎從早到晚都在奔波和記錄。

在論文長長的致謝名單裡,我們寫上了每一位助研的名字和每一位對這篇文章有貢獻的人。

在此,我也想呼籲大家一起開展跨學科的合作,期待有更多真正交叉性、有組織的科研。如果你來自社會科學領域,期待你能夠進行更多有創新性、有建設性的研究,爲真正重要的社科問題發聲;如果你來自自然科學領域,我也希望你能夠摒棄對人文社科的偏見,大家攜手共建屬於中國的學術話語體系。

社會科學對我們的生活影響深刻。今天站在科學院的演講臺上,我真心想推薦幾位我所熟知的,出身於心理學領域,並一直在爲科學的開放、共享不斷努力的青年學者。他們是,清華大學的王非,著名ID“沉默的馬大爺”;北京大學的張昕,“叨叨昕”;武漢大學的喻豐,“道德小美狗”的主人;南京師範大學的胡傳鵬,中國開放科學社區發起人;系統式家庭諮詢師李鬆蔚。

最後,我想用我非常喜歡的一個角色——李蓮花的話結尾:有的人棄劍如遺,有的人終身不負,人的信念終是有所不同的。

希望不同文化下的人能夠彼此理解、尊重、信任,能夠讓這個世界少一些極端化的思想、多一些科學和理性行爲。

謝謝大家!

本文經授權轉載自格致論道講壇(ID:SELFtalks),如需二次轉載請聯繫原作者。歡迎轉發到朋友圈。